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Obtenção da produção máxima de milho (ton/ha) 

Aqui cabe esclarecer que o sinal da estimativa do coeficiente 
à, determina se a variável dependente y (no exemplo, produção), 
terá um valor máximo ou mínimo. Se à, é negativo, y terá um 
máximo; caso contrário, se à,for positivo, y terá um mínimo. No 


exemplo 5.7.3.1), para obtenção da produção máxima de milho é 
necessário antes maximizar a função de regressão polinomial 
quadrática, ou seja, derivar esta equação e igualar a zero: 


$; =8,8421+0,0950X, — 0,00050X? 


dY: 0+0,0950-0,00100X, 
dX, 
dŷ, 
==0 = 0+0,0950-0,00100X, =0 
dX, 
= 0,0230 = 95 kg/ha (Dose de adubo nitrogenado que levará a 
0,00100 


uma produção máxima). 


Substituindo X; = 95 na equação de %, obtém-se a produção 
máxima de milho: 


9, = 8,8421 + 0,0950.(95) — 0,00050.(95)? 
9, = 8,8421 + 0,0950.(95) — 0,00050.(95)? 


ĵ; =13,3546 ton/ha (produção máxima de milho para dose de 
adubo nitrogenado de 95 kg/ha). 


101 


5 
re LP, Xy: _ (=2).27,5+ (—1).32,0+ (0).37,5+ (1).42,6+ (2).37,8 31,2 


a 3.2? HD +0)? +) +(2°] 310) = 1,0400 
LP, (X) ; 


5 
p AON (0327,5+(1)32,0+(2)37,5+(1)42,6+0)378 _ -19,0 _ 


0,4523 
EPI) ID +61)? + (2)? + (1)? + (2)?] 3.(14) 
i=l 


Lembrando que: 
X, -60 X, 
xXx. =Š ————— D— — 
' 30 30 


Dir 2: 
pigs = 
12 30 


2 


Portanto: 
y; = bo +b,P, (X, ) +b,P,(X,) 


2 
X, 
Y, =11,8267 + 1,0400 X; —2 |- 0,4523 aa A 
30 30 


Resolvendo a equação acima tem-se: 


A la = A ss a a. 
Jo PREE ERA SUPAPA (Equação da Regressão Quadrática) 
y;= à, +â,X; Ex â, X 


Os valores observados (y:i) e estimados ($,) para cada dose de 
adubo nitrogenado estão apresentados a seguir: 


Xi Yi ĵi; 

0 27,5 8,8421 
30 32,0 11,2421 
60 37,5 12,7421 
90 42,6 13,3421 
120 37,8 13,0421 


Apresentação 


A preocupação crescente da sociedade com a preservação e a 
conservação ambiental tem resultado na busca pelo setor produtivo de 
tecnologias para a implantação de sistemas de produção agrícola com 
enfoque ecológicos, rentáveis e socialmente justos. O enfoque 
agroecológico do empreendimento agrícola se orienta para o uso 
responsável dos recursos naturais (solo, água, fauna, flora, energia e 
minerais). 


Dentro desse cenário, a Embrapa Agrobiologia orienta sua 
programação de P&D para o avanço de conhecimento e 
desenvolvimento de soluções tecnológicas para uma agricultura 
sustentável. 


A agricultura sustentável, produtiva e ambientalmente equilibrada 
apoia-se em práticas conservacionistas de preparo do solo, rotações de 
culturas e consórcios, no uso de adubação verde e de controle 
biológico de pragas, bem como no emprego eficiente dos recursos 
naturais. Infere-se daí que os processos biológicos que ocorrem no 
sistema solo/planta, efetivados por microrganismos e pequenos 
invertebrados, constituem a base sobre a qual a agricultura 
agroecológica se sustenta. 


O documento 163/2003 atende uma demanda daqueles que atuam na 
pesquisa agropecuária, principalmente estudantes e profissionais 
recém ingressados na área, disponibilizando, de forma objetiva e 
prática, conceitos de estatística aplicados à experimentação em 
Ciências Agrárias. Na verdade, existem poucas publicações sobre o 
referido tema e este documento serve de roteiro para orientar aspectos 
básicos do planejamento da experimentação de campo e análise dos 
resultados obtidos. 
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FV GL SQ QM F Prob>F 
(Doses) 4 45,3160 11,3290 13,122 0,0005 
Regressão Linear 1 32,4480 32,4480 37,586 0,0000 
Regressão Quadrática 1 8,5952 8,5952 9,956 0,0100 
Desvio 2 4,2728 2,1364 2,475 0,1340 
Erro 10 8,6333 0,8633 
Total 14 
CV (%)= 7,86 
Média geral: 11,83 Número de observações: 15 


Observa-se no quadro anterior que tanto a regressão linear quanto a 
quadrática foram significativas ao nível de significância estabelecido 
de 5% (Prob<0,05). O coeficiente de determinação (R°) para a 
regressão linear e quadrática foram respectivamente: 


32,4480 
45,3160 
8,5952 


R’ (Quadrática) ==" 100 = 19,0% . 
45,3160 


Rº (Linear) .100 = 71,6% ; 


Apesar do R° da regressão quadrática ter sido baixo (19%), deve-se 
observar o valor de Prob>F do Desvio. Se este valor for maior que 
0,05, indicando que o desvio foi não significativo, deve-se, portanto, 
considerar a equação de regressão significativa de maior grau, no 
caso, a quadrática: 


Îi = Bo +B,X+B,xº = bo +b,P(X) +b,P,(X,) 


em que 
3 
yi 
ae a ado 
3x5 15 
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Para cada nível de X tem-se então: 


Níveis Dose de adubo Totais yi(das 3 repetições) P(X) P(X) 
1 0 27,5 2 +2 
2 30 32,0 -1 -1 
3 60 37,5 0 -2 
4 90 42,6 +1 -1 
5 120 37,8 +2 +2 
Total 177,4 


Técnicas Experimentais aplicadas às 
Ciências Agrárias 


Janaína Ribeiro Costa 


1. Noções básicas de experimentação agrícola 


As somas de quadrados (SQ's) da regressão linear e quadrática são 
dadas por: 


N 


zA ; LP, (X;).y; 
SQRegressão 1(Linear) = Ai! - 
35 P X;) 
i=l 
[(-2).27,5+(-1).32,0+ (0).37,5+ (1).42,6+ (2).37,8P 973,44 
= =32,4480 
3[(-2) +1)? +0? + (1) +(2)7] 3.(10) 
5 2 
f iie P, (X; ).y; 
SQRegressão 2 (Quadrática) = \i=! f 
3} P; X;) 
i=l 
2 
[(2).27,5 +(—1).32,0 + (-2).37,5 +(-1).42,6 +(2).37,8]” _ 361 -8,5952 


BUD +CD? +(D +E HO] 3.14) 
SQDesvio = SQ Doses — SQRegressão 1 — SQRegressão 2 
= 45,3160 — 32.4480 — 8,5952 =4,2728 


O quadro de análise de variância com o desdobramento dos graus 
de liberdade da fonte de variação ‘doses’ em graus de liberdade 
devido a regressão polinomial está apresentado a seguir. 
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A Estatística Experimental é a ciência que tem como objetivo 
estudar experimentos (ensaios), englobando etapas como o 
planejamento, execução, coleta e análise dos dados experimentais 
e interpretação dos resultados obtidos. Ela foi proposta inicialmente 
na área de ciências biológicas por Ronald A. Fisher em 1919. Fisher 
propôs o uso da análise de variância (ANAVA) como ferramenta 
para análise e interpretação de dados. A ANAVA permite a 
decomposição do grau de liberdade e da soma de quadrados total 
em somas de quadrados correspondentes às fontes de variação 
previamente definidas no planejamento do experimento. 


A fase de planejamento do experimento merece considerável 
atenção por parte do pesquisador pois dela dependerá o sucesso da 
análise e interpretação dos resultados sendo, portanto, 
recomendável uma consulta a um estatístico antes da instalação do 
experimento. 


O planejamento envolve etapas como: 
a) Formulação de hipóteses 


A hipótese estatística formulada é denominada hipótese de nulidade 
e é simbolizada por Ho. Suponha que se deseja estudar qual estirpe 
de bactéria diazotrófica endofítica (considerando, por exemplo, três 
estirpes diferentes) proporcionará maior peso da parte área de 
cana-de-açúcar. No exemplo, Ho seria: não existem diferenças 
significativas entre os efeitos das estirpes (ou seja, qualquer 
diferença observada é devida a fatores não controlados). Ho poderá 
ser aceita ou rejeitada; caso seja rejeitada, aceitaremos uma 
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hipótese denominada alternativa, simbolizada por H, que no 
exemplo seria: os efeitos das estirpes diferem significativamente 
entre si (ou as estirpes se comportam de modo diferente quanto ao 
peso da parte aérea). 


b) Escolha dos fatores e seus respectivos níveis 


Fatores (ou tratamentos) são aqueles que o pesquisador tem 
interesse em estudar o seu efeito sobre as variáveis respostas. As 
subdivisões de um fator são os níveis dos mesmos. Por exemplo, se 
o interesse for planejar um experimento para se estudar o efeito de 
6 tipos diferentes de rotações de cultura, o fator em estudo é 
rotação e os níveis deste fator são os 6 tipos de rotação. 


Em alguns casos, como por exemplo nos experimentos fatoriais ou 
em parcelas subdivididas, dois ou mais fatores são estudados. 
Suponha que se deseja estudar o efeito de 2 variedades de cana de 
açúcar e 3 doses de nitrogênio; neste caso se trata de um 
experimento em fatorial 2x3, em que se tem dois fatores (variedade 
e dose de nitrogênio); 2 níveis do fator variedade e 3 níveis do fator 
dose de nitrogênio. 


Um fator pode ser classificado em: 


b.1) Qualitativo: quando os níveis do fator são categorias, atributos. 
Por exemplo: nome de variedades de cana de açúcar (SP701143 e 
SP813250); métodos de extração de DNA (Cullen, Smalla, Sebach); 
origem de solos (MG, RJ, BA, SP); etc. 


b.2) Quantitativo: quando os níveis do fator são mensurações de 
valores reais. Normalmente os níveis são valores numéricos 
acompanhados de uma unidade de medida. Por exemplo: dose de 
nitrogênio (0, 25 e 50 Kg/ha); concentrações de antibiótico (25, 50, 
100, 200 ug/ml), etc. 


c) Escolha da parcela (unidade experimental) 


Parcela é a unidade experimental que receberá o tratamento. A 
parcela pode assumir diferentes formas e tamanhos. Por exemplo, 
uma parcela poderá ser constituída por uma ou várias plantas; um 
vaso contendo uma ou mais plantas; uma placa de Petri com 
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X,-X X,-60 


tem-se que Pi(X;) = X; em que x, = ; z com i =1,2,... 
5. Portanto, 
P(X, =0) -29 
P (X, =30) = = = 
P (X, =60) = = =0 
P (X, =90) = -— =+] 
P (X, =120) «=» 
21 5? -1 


e tem-se que P(X) = x? RG ERA -2 
com i =1, 2, ..., 5. Portanto, 

P(X, = 0) = (2)? -2 = +2 

P, (X, =30) = (1) -2 =-1 

P, (X, =60) =(0)°-2=-2 

P, (X, =90) = (+1)? -2=-1 

P, (X, =120) = (+2) -2 = +2. 
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A análise de variância para os dados do exemplo 5.7.3.1) é: 


FV GL SQ QM F Prob>F 
Doses 4 45,3160 11,3290 13,122 0,0005 
Erro 10 8,6333 0,8633 
Total 14 


Rejeita-se Ho, concluindo-se pela existência do efeito de doses 
crescentes de adubo nitrogenado sobre a produção do milho (Prob 
< 0,05). 


Considerando o modelo de regressão polinomial de 22 grau a 
seguir, foi realizada a análise de regressão: 


y; =â, +â, X, +â,X? +å, 
reescrevendo este modelo pela expressão alternativa: 
Yi= bo + biPi(X)) + DoP>(X;) + € ; i =1, 2, or 


As hipóteses testadas no modelo de regressão adotado são: 
i) Ho: b4 =0 VS Hı: b4 +0. 
ii) Ho: bo = O vs H1: b2 #0. 


Para obtenção das somas de quadrados das regressões linear e 


quadrática é necessário antes calcular os coeficientes dos 
polinômios P4(X;) e P2(X:). 


Seja: 
Zan =5(0+30+60+90+120) =60; 
n i=l 
q = 30 (correspondendo a 30-0 ou 60-30 ou 90-60 ou 120-90) 
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determinado meio de cultura; uma área com várias plantas; um 
animal; etc. 


d) Escolha do delineamento experimental 


Delineamento experimental é o plano de distribuição dos 
tratamentos na área experimental. Como exemplo de delineamentos 
tem-se o delineamento inteiramente casualizado (DIC), o 
delineamento em blocos casualizados (DBC), o delineamento em 
quadrados latinos (DQL), os delineamentos em blocos incompletos 
(por exemplo, os látices, blocos aumentados, etc.). 


e) Escolha das variáveis a serem analisadas 


Variáveis respostas ou variáveis dependentes ou simplesmente 
variáveis são características obtidas em cada parcela. Os dados 
(observações) são realizações de uma variável e serão analisados 
para verificar se há diferença entre os níveis dos fatores 
(tratamentos). Assim, exemplos de variáveis são: produção de grãos 
de feijão; altura de plantas de milho; pH, teor de Ca, Mg e P em 
amostras de solo; número de plantas de cana-de-açúcar atacadas 
por cercosporiose; etc. 


Uma variável também pode ser classificada, semelhantemente aos 
fatores (tratamentos), em: 


e.1) Qualitativa 


e.1.1) Nominal: quando são categorias, atributos, sem uma 
ordenação natural. Por exemplo: cor dos grãos do feijoeiro (marrom, 
preto, branco); textura do solo (arenoso, argiloso, silte); etc. 


e.1.2) Ordinal: quando são atributos com uma ordenação natural. 
Por exemplo: suscetibilidade do cafeeiro à ferrugem (alta, média, 
baixa); nota para o ataque de cercosporiose em cana-de-açúcar 
(escala de 1, para ausência da doença, até 9, para o máximo de 
doença); etc. 


e.2) Quantitativa 
e.2.1) Discretas: quando são contagens de números inteiros 
positivos com uma ordenação natural. Por exemplo: número de 
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chuvas em 2002 superior a 80 mm/h (ex. 20 chuvas); número de 
plantas atacadas com a broca do fruto do cafeeiro (ex. 200 plantas); 
número de minhocas encontradas em determinada amostra de solo 
(ex. 50 minhocas). 


e.2.2) Contínuas: quando são mensurações de valores reais; 
normalmente existe uma unidade de medida acompanhando a 
variável. Por exemplo: produtividade (100,0 kg/ha); renda 
(R$2050,73/mês); altura (2,5 m); diâmetro (8,18 cm); peso (98,5 g); 
pH (5,5); teor de P, Ca, Mg, K, matéria orgânica, etc. 


f) Análise dos dados obtidos com o experimento. 


2) Distribuição de frequências 


2.1) Definição 


Consiste em uma função que associa os valores que uma variável 
assume com suas frequências de ocorrência, podendo ser elas 
absolutas, relativas ou porcentuais. 


2.2) Freqiiência 

É uma medida que quantifica a ocorrência dos valores de uma 
variável. 

2.2.1) Frequência absoluta (fa) é o número de observações 
ocorridos em cada classe da variável estudada. 


2.2.2) Frequência relativa (fr) é dada pela divisão da fa pelo 
número total (n) de dados ou observações: 
pen 
n 


2.2.3) Freqüência porcentual (fp) é dada pela multiplicação de fr 
por 100: 


fp (%) = fr.100. 


SQRegressão k = += , associada a 1 grau de liberdade. 


O coeficiente de determinação (R°) em experimentos com repetição 
é dado por: 


Rom) = S Q Regressiok pas , 0< RÊ< 100. 
SQTratamen to 


5.7.3.1) Exemplo de análise de regressão em dados com 
repetição: modelos de regressão polinomial 


Um experimento foi instalado conforme o delineamento inteiramente 
casualizado, com três repetições para testar o efeito de 5 doses de 
adubo nitrogenado (0, 30, 60, 90 e 120 kg/ha). Os resultados 
obtidos em ton/ha de milho são: 


Rep\Doses 0 30 60 90 120 
1 8,6 10,5 12,5 12,6 13,7 

2 9,5 10,0 12,8 15,1 12,8 

3 9,4 11,5 12,2 14,9 11,3 
Total 27,5 32,0 37,5 42,6 37,8 


O modelo do exemplo anterior adotado foi: 

yY; =5U+di +8; ; i=1,2,..,5 ej=1,2,3. 
em que yj é o valor observado referente a i-ésima dose de adubo 
nitrogenado na j-ésima repetição; d é a i-ésima dose de adubo 


nitrogenado e s; é O erro experimental associado a yj com si ^ N (0, 
o°) e independentes. 


As hipóteses testadas na análise de variância são: 
Ho: dı =d2=... =dn=0; i=1, 2, PERA A 
Hı: pelo menos um di; difere de 0. 
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Pa(X;) 


3_3n°-7 
i 20 


Aj 


i 


Ps(X) = x: 
s(X) = x; T 


em que, 


14 


T 3n? E P 3(n? —1)(n? —9) . 


560 


m 


X; são os níveis da variável independente; 


x=1yx, é a média dos níveis de X; 


ni- 


q é amplitude entre dois níveis consecutivos de X; 
n é o número de níveis da variável independente (X). 


O estimador de quadrados mínimos de bą, é dado por: 


b, = 


em que, 


P(X) são os coeficientes do polinômio ortogonal de grau k 


associado ao nível do fator; 


LP(XDy; 


LP, (X;) 


so 5(nº -7) , z 15nº —- 230n” + 407 


1008 


y; é o total do nível i da variável dependente (y); 


r é o número de repetições. 


A hipótese de nulidade é Ho: bę = 0 e a hipótese alternativa é H;: bx 
+ 0. A soma de quadrados da regressão de grau k, na análise de 


variância, é dada por: 


94 
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Exemplo 1. No quadro a seguir está disposta a atividade agrícola 
predominante em cada uma das 20 propriedades rurais do 


município Vida Alegre. 


Milho Soja 

Soja Soja 

Leite Cana-de-açúcar 
Milho Leite 

Milho Laranja 


Olericultura 


Milho 
Trigo 
Soja 

Milho 


Leite 
Milho 
Milho 
Trigo 
Olericultura 
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A variável em estudo, atividade agrícola, é classificada como 
qualitativa nominal. Uma maneira mais informativa de descrever o 
conjunto de dados do Exemplo 1 é através da distribuição de 
frequências das categorias desta variável, podendo ser feita por 


meio de representação tabular ou gráfica. 


a) Representação tabular: 


Tabela 1. Distribuição de frequência das atividades agrícolas de 20 
propriedades rurais do município de Vida Alegre 


Atividade predominante fa fr fp (%) 
Milho T 0,3500 35,0 
Soja 4 0,2000 20,0 
Leite 3 0,1500 15,0 
Trigo 2 0,1000 10,0 
Olericultura 2 0,1000 10,0 
Cana-de-açúcar 1 0,0500 5,0 

Laranja 1 0,0500 5,0 

Total 20 1,0000 100,0 


Fonte: Apostila de Estatística Básica (Bearzoti & Oliveira, 1997). 
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b) Representação gráfica: 
Gráfico é uma figura para ilustração de fenômenos ou tendências 
onde existem escalas definidas. 


Para a representação gráfica de variáveis qualitativas, como é o 
caso do Exemplo 1, os gráficos mais utilizados são: 


e Gráfico de linhas: possui dois eixos, com fa ou fr ou fp 
disposta no eixo vertical e as classes (categorias) da variável 
dispostas no eixo horizontal. 


Atividade 


Figura 1. Gráfico de linhas representando a distribuição de frequência relativa referente à 
atividade agrícola predominante em propriedades do município de Vida Alegre. 


Análise de regressão em dados com repetição: modelos de 
regressão polinomial 


O modelo de regressão polinomial de grau p, para uma única 
variável independente é representado por 

y; =â, +â,X; +â,X; +â,X} +...+â, X? +å, (i) 
com i = 1, 2, ..., n ; &i^ N(0, o°) independentes. Bo, Bi, ..., Bn são 
parâmetros da regressão a serem estimados. 


Considerando n pares de dados (y1, X1), (Y2, X2), ..., (Yn, Xn) em que 
n>p e que os níveis referentes a variável X são todos equidistantes, 
ou seja, X1=X1; X2=X1+q, X3=X2+q , ..., Xn=Xn-1+q, O modelo em (i) 
pode ser reescrito como: 


Y= bo + biPi(X;) + DoPo(X;) ++ DoPp(Xi) + £i 


com i=1,2,..,n;em N(0, o°) independentes. bo, by, ..., bn são 
parâmetros da regressão a serem estimados e P(X) sendo um 
polinômio ortogonal de ordem k = 1, 2, ..., p que deve atender às 
seguintes restrições: 


i) Po(X)=1; 

i) DP(X)=0; 

ii) $P, (X;).Pe(X;)=0 para kk; 
iv) LP?(X,)+0. 


Os valores de P(X) (k =1, 2, ...,p), quando os níveis da variável X 
são eqüidistantes, podem ser obtidos através das seguintes 
expressões: 


X =X 
P(X) = Xi; em que x; = — : 
q 
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Îi F b, +b,X; 

em que 

i 10.388) +15.(1,426) +...+55.0,130) — D2270 

b, = - 

10°? +15° +...+55° _ 825) 
10 
p= 303,6650- 408,1525 -15,0875 __ 0,0073 (estimativa de by), 
2062,5000 2062,5000 

b, = an - cooo F = 1,2577 + 0,2373 = 1,4950 (estimativa de bo). 


O modelo de regressão ajustado (estimado) é: 


ĵi =1,4950 — 0,0073X; . 
O R? foi de: 


g2 — 01104 


= .100 = 90% 
0,1255 


indicando que 90% da variação na densidade do solo é explicada 
pelo modelo de regressão utilizado. 


No quadro a seguir para cada valor de X; tem-se o valor observado, 
o estimado e o desvio correspondente. 


Xi yi (valores observados) q, (valores estimados) Yi-9, 

10 1,388 1,422 -0,034 
15 1,426 1,386 0,040 
20 1,393 1,349 0,044 
25 1,341 1,313 0,029 
30 1,26 1,276 -0,016 
35 1,16 1,240 -0,080 
40 1,177 1,203 -0,026 
45 1,153 1,167 -0,014 
50 1,14 1,130 0,010 
55 1,139 1,094 0,045 
Total 12,577 12,577 0 

Média 1,2577 1,2577 0 
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e Gráfico de barras ou colunas: semelhantes aos gráficos de 
linhas, com a diferença que são usadas barras (colunas) ao 
invés de linhas. 


04 

0.3 

0.2 

01 E 

l O 
O K A os 
N9 ON DN O o q Q 
` 92 SS Ss 

Atividade 


Figura 2. Gráfico de barras verticais representando a distribuição de freglência relativa 
referente ãatividade agrícola predominante em propriedades do município de Vida Alegre. 


e Setograma (gráfico circular ou gráfico de setores): gráfico 
circular no qual os setores correspondem as categorias com 
áreas proporcionais as frequências de cada classe. Para 
construção do setograma é necessário obter o ângulo 
referente ao setor de cada categoria, por meio de uma regra 
de três. Por exemplo, para a atividade milho do Exemplo 1, 
tem-se a regra de três para as frequências porcentuais dada 


por: 
100% — 360º 

35% — * 
x = 126º. 


E assim por diante são calculados os outros ângulos 
correspondentes aos setores das outras categorias que serão 
traçados no gráfico. 
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Laranja 
Cana 


Olericultura Milho 
Trigo 
Leite 


Soja 


Figura 3. Setograma representando a distribuição de freguência relativa referente à 
atividade agrícola predominante em propriedades do município de Vida Alegre. 


Exemplo 2. O quadro seguinte apresenta o número de lagartas 
rosca encontradas em cada um dos 16 canteiros de um viveiro de 
mudas de eucalipto. 


owh re 
Sr mnh 
SN EU 
pH pa 


A variável número de lagartas rosca é classificada como quantitativa 
discreta. A distribuição de frequências para variáveis quantitativas 
discretas são semelhantes à das variáveis qualitativas, como no 
caso do Exemplo 1, com os valores inteiros que a variável assume 
podendo ser considerados como “categorias” ou “classes naturais”. 


a) Representação tabular: 


Tabela 2. Distribuição de frequência do número de lagartas rosca 
em canteiros de um viveiro de eucalipto 


Nº de lagartas rosca fa fr fp (%) 
0 2 0,1250 12,5 

4 0,2500 25,0 

2 2 0,1250 12,5 

3 2 0,1250 12,5 

4 4 0,2500 25,0 

5 2 0,1250 12,5 

Total 16 1,0000 100,0 


Fonte: Notas de aula. 
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Hı: b4 +0. 
As somas de quadrados para o exemplo anterior foram: 


(325).(12,577) V 
je 10.(1, 15.(1,426) +... + 55.1,139) — SEAE 
ETE | 0.(1,388) +15.(1,426) + ... + 55.(1,139) | 
2 
102 +152 +... 455º — (325) 
10 
2 2 
SQnegiessáo = [393,6650 - 408,7525] _ (-15,0875)° _ paia 
2062,5000 2062,5000 
2 
SQTotal = 1,388? +1,426º +...+1,139º Sir 
SQTotal = 15,9436 — 15,8181 = 0,1255 
SQDesvios = 0,1255 — 0,1104 = 0,0151 
O Quadro de análise de variância resultante é: 
FV GL SQ QM F Prob>F 
Regressão 1 0,1104 0,1104 58,105 0,0001 
Desvios 8 0,0151 0,0019 
Total 9 0,1255 


Da Tabela de F tem-se que Fçs; 1; 8) é 5,32 e como 58,105 > 5,32, 
rejeita-se Ho ao nível de 5% de significância. Atualmente, os 
programas computacionais apresentam uma coluna a mais no 
quadro de análise de variância correspondente a Prob>F, não 
havendo a necessidade de procurar o valor de F em Tabela. 
Quando Prob>F for menor que 0,05, significa que o teste F foi 
significativo, ou seja, o pesquisador poderá rejeitar H, e aceitar H4. 
No exemplo, conclui-se então que as densidades (g/cm?) em 
diferentes profundidades X (cm) podem ser explicadas por meio do 
seguinte modelo de regressão linear: 
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SQDesvios = Ly, — $,)? = SQTotal - SQ Re gessão, associada a (n- 
2) graus de liberdade. 
A decisão de rejeitar H, ao nível a de significância se dará se 
QM Re gressão SË 
QMDesvios 


> Fia, 1, n-2) 


em que Fia, 1, n-2) é O valor tabelado obtido através da Tabela de F- 
Snedecor para o nível a de significância, 1 e (n-2) graus de 
liberdade. 


O coeficiente de determinação (R°) é a estatística dada por: 


SQ Re gressão 


R? (%) = 
SQTotal 


100, 0<R?<100. 


O R° procura quantificar a proporção da variação da variável y que é 
explicada pelo modelo de regressão. Quanto mais próximo de 100 
estiver Rê, melhor a qualidade de ajuste do modelo de regressão 
aos dados. 


5.7.2.1) Exemplo de análise de regressão em dados sem 
repetição 
Um estudo foi realizado sobre zonas de compactação em perfis de 
um solo, obtendo-se os seguintes dados de densidade (g/cm?) em 
diferentes profundidades X (cm) 

Total 


X (cm) 10 15 20 235 30 35 4 45 50 55 325 


y (g/cm?) 1,388 1,426 1,393 1,341 1,260 1,160 1,177 1,153 1,140 1,139 12,577 


O modelo adotado foi: 
y=bo+bX+e, d=1,2,...,10 e sAN (0, o’). 
E as hipóteses testadas foram: 
Ho: b; = 0 
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A representação gráfica também é semelhante à do Exemplo 1, com 
os valores inteiros no eixo horizontal, representando as classes da 
variável (número de lagartas). 


Exemplo 3. Considere os valores a seguir referentes ao diâmetro à 
altura do peito (DAP), em cm, de 54 árvores de um talhão 


10,7 17,2 21,2 22,9 24,2 25,9 28,8 32,8 36,1 
12,4 17,6 21,6 23,3 24,4 26,1 29,5 33,6 37,5 
13,8 18,8 21,8 23,5 24,4 26,1 30,2 34,2 38,1 
14,6 19,2 22,2 23,8 24,6 26,8 30,9 34,5 39,0 
16,1 20,5 22,3 23,9 24,8 27,5 31,3 34,7 39,7 
16,8 20,9 22,8 24,2 25,5 28,1 32,0 35,5 41,2 
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A variável DAP é classificada como quantitativa contínua. A 
distribuição de frequências para variáveis quantitativas contínuas 
são diferentes daquelas discretas e das variáveis qualitativas. 


Primeiramente, para a realização de uma distribuição de frequências 
de uma variável contínua, os dados devem ser ordenados em ordem 
crescente para uma melhor manipulação dos mesmos. 


Depois segue-se a um algoritmo para a obtenção da distribuição de 
frequências. Neste algoritmo, alguns passos são diferenciados se os 
dados são referentes a uma população ou a uma amostra. 


i) Para população: escolher um número de classes (k) entre 5 e 20. 


Para amostra: 


Tamanho da amostra (n) Número de classes (k) 
Até 100 vn 
> 100 5 logio n 


ii) Calcular a amplitude total (A) dos dados: 
A = MVO — mvo 


em que MVO é o maior valor observado e mvo é o menor valor 
observado; 


iii) Calcular a amplitude de classe (c): 


pende (população) ou E aa 
k populaç k] 


(amostra) 


em que Ax é a precisão de medida (menor valor detectável pelo 
instrumento ou método de medição). O valor de c deverá ser 
arredondado para o mesmo número de casas decimais dos dados; 


iv) Calcular o limite inferior da 1º classe (Ll4): 
Ax = c 
LI, = nO (população) ou LI, = oen (amostra); 


v) Calcular o limite superior da 1º classe (LS4): 
LS, = LI, +C 


LS, além de limite superior da 12 classe, também é o limite inferior 
da 2º classe: 


LS, = Ll 
LS, = Ll2+ c 
e assim sucessivamente até terminar as k classes; 


vi) Calcular as frequências absolutas (fa) e, opcionalmente, as 
relativas (fr) e porcentuais (fp) de cada classe: 


Aplicando-se então o algoritmo nos dados do Exemplo 3, 
considerando que eles são referentes a uma população tem-se: 


i) Escolhe-se, por exemplo, k = 10 classes; 
ii) A = 41,2 — 10,7 = 30,5; 


 30,5+0,1 


iii) c = 3,06 = 3,1 (arredondando ) ; 


16 


n LX: Lyi 
DX; = i=l i=1 
b, — i - n - 
i LX; 
x? =» i=1 
2 ' n 


A partir destes estimadores tem-se o modelo de regressão linear 
simples estimado (ajustado): 


ĵi = b, + bX, E 
5.7.2) Análise de regressão em dados sem repetição 


Seja a hipótese de nulidade em uma análise de regressão Ho: b; = O 
e a hipótese alternativa H;: b4 + 0, o esquema da análise de 
variância da regressão para se testar estas hipóteses é: 


FV GL SQ QM F 

Regressão 1 SQRegressão SQRegressão/1  QMRegressão/QMDesvios 
Desvios n-2 SQDesvios SQDesvios /(n-2) 

Total n-1 SQTotal 


Em que as somas de quadrados (SQ's) são dadas pelas seguintes 
expressões: 


2 
Ly: 
SQTotal = (y, -y) p È), associada a (n-1) graus de 
i=l i=1 n 
liberdade. 


SQRegressão = ¥ (9, -y)? =|" i , associada a 1 grau de 
i=l 


liberdade. 
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A princípio, qualquer relação funcional entre um conjunto de 
variáveis regressoras e um conjunto de variáveis dependentes, 
representada por y = X1, X2, ..., Xk), pode ser chamada de modelo 
de regressão, sendo tal modelo fixo para determinado conjunto de 
dados. 


Normalmente esta relação funcional é desconhecida e uma função 
alternativa pode ser usada para aproximar f como, por exemplo, os 
modelos polinomiais que estão incluídos entre os tipos de modelos 
de regressão linear simples e são amplamente utilizados (Nogueira, 
1997). 


Um modelo de regressão linear é dito simples quando envolve 
somente uma variável regressora X. Os exemplos anteriores a) e c) 
se enquadram em casos de regressão linear simples. Já o exemplo 
b) é típico de regressão linear múltipla pois envolve mais de uma 
variável regressora (no caso, duas). O exemplo d) é um caso de 
regresão linear múltipla multivariada (múltipla pois apresenta 3 
variáveis regressoras e multivariada pelas duas variáveis respostas, 
yı € yə, utilizadas). 


Sejam n pares de dados de duas variáveis (Xi, yi) com i = 1, 2, ..., N. 
Admitindo que a relação entre yi e X; é uma reta, tem-se o modelo 
de regressão linear simples: 


yi = bo + b;X+ £i 


em que s£; é o erro experimental associado a observação yi; bo e bı 
são parâmetros correspondentes ao coeficiente linear ou termo 
constante (intercepto da reta) e coeficiente angular ou de regressão, 
respectivamente. Os estimadores de quadrados mínimos de bo e b; 
são dados por: 
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Observação: Note que, como os dados têm apenas uma casa 
decimal após a vírgula, o Ax é 0,1, se houvesse 2 casas após a 
vírgula, Ax seria 0,01 e assim por diante. 


iv) LI, = 10,7 = 


=10,65 


v) LS; = 10,65 + 3,1 = 13,75 
Ll = LS1 =13,75 
LS, = 13,75 + 3,1 = 16,85 e assim por diante. 


a) Representação tabular: 


Tabela 3. Distribuição de frequência do diâmetro à altura do peito 
(DAP), em cm, de 54 árvores de um talhão 


Classes de DAP Ponto médio fa fr dfr fp (%) 
[10,65; 13,75) 12,2 2 0,0370 0,0119 3,70 
[13,75; 16,85) 15,3 4 0,0741 0,0239 7,41 
[16,85;19,95) 18,4 4 0,0741 0,0239 7,41 
[19,95; 23,05) 21,5 9 0,1667 0,0538 16,67 
[23,05; 26,15) 24,6 14 0,2592 0,0836 25,92 
[26,15; 29,25) 27,7 4 0,0741 0,0239 7,41 
[29,25; 32,35) 30,8 5 0,0926 0,0299 9,26 
[32,35; 35,45) 33,9 5 0,0926 0,0299 9,26 
[35,45; 38,55) 37,0 4 0,0741 0,0239 741 
[38,55; 41,65) 40,1 3 0,0555 0,0179 555 
Total - 54 1,0000 E 100,00 


Fonte: Notas de aula. 
b) Representação gráfica: 


Normalmente em gráficos de distribuição de frequências de 
variáveis quantitativas contínuas usa-se no eixo vertical do gráfico a 
densidade de frequência (df) de cada classe dada por: 


densidade de frequência (df) = freatiência da classe 


amplitude da classe 


Assim, pode-se usar a densidade de frequência absoluta (dfa) ou a 
relativa (dfr) ou, ainda, a porcentual (dfp) obtidas, respectivamente, 
por: 
dns É ; ikas die 
c c c 

Na Tabela 3 foram apresentadas as dfr's (com c=3,1). O uso de df 
se torna importante nas situações onde as amplitudes de classes (c) 
são desiguais e, também, permite o cálculo de freqüências a partir 
de áreas do gráfico. Mas se c é igual para todas as classes pode-se 
utilizar, no eixo vertical do gráfico, tanto frequências como 
densidades de freqüência. 


Visto o conceito de df, os dois gráficos mais usais para distribuição 
de frequências de variáveis contínuas são o histograma e o polígono 
de frequência. 


b.1) Histograma: é semelhante ao gráfico de barras, com barras 
dispostas lado a lado, e larguras iguais às amplitudes de classes. 


0.1 dfr 


0.08 

0.06 

0.04 

0.02 
0 
ONO DDD DDS DO 
CND DNDMUNVDDLDSO,O 

DAP 


Figura 4. Histograma de distribuição de freguência relativa referente ao diâmetro à 
altura do peito (DAP), em cm, de 54 árvores de um talhão. 


Os resultados do teste de Tukey comparando as médias das 
Variedades para 1 e 2 linhas de irrigação está apresentado a seguir: 


VariedadeslLinhas T, T, 
Ti 17,80 C 1740 b 
T2 19,10 bc 19,10 ab 
T3 20,50 ab 19,80 a 
T4 21,18 a 17,40 b 


Médias seguidas de mesma letra não diferem entre si pelo teste de Tukey (Prob > 0,05). 


5.7) Análise de regressão 
5.7.1) Características 


Na pesquisa agropecuária é frequente o interesse no estudo de 
relações funcionais entre variáveis quantitativas, como por exemplo: 


a) Estudar a resposta na produção de grãos (y) em função de 
doses (X) de nitrogênio aplicadas ao solo, simbolizado por y = 
AX); 


b) Estimar o volume de madeira (y) em árvores de um povoamento 
florestal sem ter que derrubá-las, através da medida de seus 
diâmetros (X4) e alturas (X2), simbolizado por y = X4, Xə); 


c) Expressar a curva de crescimento (y) de aves em função do 
tempo (X), simbolizado por y = ÑX) 


d) Determinar como o número de brotos (yı) e seu peso seco (y2) 
são afetados pelas doses de meio de cultura MS (X;), de 
sacarose (X2) e pH (X3), simbolizado por y1, Y2 = X1, X2, X3). 


As variáveis y's dos exemplos anteriores que se deseja descrever 
são chamadas variáveis dependentes ou respostas e as variáveis 
X's são denominadas independentes ou regressoras. 


Na natureza, certamente uma variável y que se deseja descrever, é 
determinada por um conjunto de outras variáveis, X4, X2, ...... , Xk 
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Variedade 2/ Linha 1 = T,T, = Si =19,10 
Variedade 3/ Linha 1 = TIS = = 20,50 
Variedade 4/ Linha 1 = T,T, = = =21,18 
- Comparando Médias de T para T,: 
Variedade 1/ Linha 2 = T,T, = He = 17,40 
Variedade 2/ Linha 2 = T,T, = £ =19,10 
Variedade 3/ Linha 2 = T;T, = 2 =19,80 
Variedade 4/ Linha 2 = T,T, = ce = 17,40 
Teste de Tukey: 

DMS =q | QMErro Málio 

r 

sendo q para 0=0,05; | = 4 tratamentos principais (Variedades) e 


GLErro Médio= n =21 > q=3,9: 
DMS = 3,95, | e = 2,00. 
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b.2) Polígono de frequência: quando as amplitudes de classe (c) são 
iguais, o polígono é obtido pela união dos pontos médios das 
classes, nas alturas correspondentes às df's. 


O polígono deve ser unido, no eixo horizontal, nos pontos: 
eo é sas 
2 2 


em que LS,é o limite superior da última classe (k). No Exemplo 3 os 
pontos de união ao eixo horizontal são: 


10,65- Ž1 =94 e 4165+ 2l = 43,2. 


0.1 dfr 


0.08 - 
0.06 - 
0.04 - 
0.02 - 
o 


E SR O e a bn a E K aN 
ae Raa a sm T F 


DAP 


Figura 5. Polígono de freqüência relativa referente ao diâmetro àaltura do peito (DAP), 
em cm, de 54 árvores de um talhão. 


2.3) Natureza da distribuição 


O objetivo da distribuição de frequência é descrever o 
comportamento da variável. A natureza desse comportamento pode 
ser simétrica, assimétrica à direita ou à esquerda, como pode ser 
visualizado na Figura 6. Adiante será visto como se quantifica a 
assimetria. 


ii) 


Assimétrica à direita 


iii) 


Assimétrica à esquerda 


Figura 6. Natureza da distribuição dos dados i) simétrica, ii) assimétrica àdireita ou 
iii) assimétrica àesquerda. 


3) Estatísticas descritivas 


3.1) Medidas de posição 


Definição: é um número que descreve um conjunto de dados, pela 
indicação da posição que o conjunto ocupa na escala de valores 
possíveis que a variável em questão pode assumir. 


3.1.1) Média (X ou Me) 


20 


SQ Variedade /Linha 2 = SQT/T; = 1696 +76,4? +79,2? +69,6? 
SQT/T, = 5449,4800 — 5431 ,6900 = 17,7900. 


je (294,8) 
16 


Para certificar se o cálculo das somas de quadrados do 
desdobramento Variedades dentro de Linhas foi realizado 
corretamente basta verificar: 


SQT+SQTxT = SQ T/T +SQ T/T, 
26,9635 + 17,9184 = 27,0919 +17,7900 
44,8819 = 44,8819 ok! 


A análise de variância para o desdobramento T/T é: 


FV GL SQ QM F Prob>F 
T/T; (l-1) = 4-1 =3 27,0919 9,0306 8,848 0,0005 
T/T, (l-1) =4-1=3 17,7900 5,9300 5,810 0,0047 
Erro Médio 21 - 1,0207 


Da análise de variância anterior observa-se que houve diferença 
significativa entre efeitos de Variedades (T), no comprimento da 
banana, tanto para 1 linha de irrigação quanto para 2 linhas de 
irrigação (Prob < 0,05). Podemos então utilizar, por exemplo, o teste 
de Tukey para comparar as médias de T (Variedades) para T (1 


linha de irrigação) e também para T, (2 linhas de irrigação). 
Médias: 
- Comparando Médias de T para T,, do Quadro 3 pode-se obter: 


Variedade 1/Linha 1 = TT = a 


=17,80 
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Linha 1/ Variedade 4 = 21,18 a 
Linha 2/ Variedade 4 = 17,40 b 


d) Comparações entre médias de tratamentos principais dentro de 
cada nível de tratamento secundário (médias de Variedades dentro 
de cada Linha — T/T’): 


Esta comparação envolve os dois erros por meio de um erro médio, 
sendo portanto um pouco mais complicada que as demais. 
QMErro(a) + (K — 1).QMErro (b) 

K 


OMEno Médios Oi = DALON apos 


O número de graus de liberdade (n” associado a este Erro Médio é 
calculado de modo aproximado pela fórmula de Satterthwaite: 
— [QMErro(a)+ (K —1).QMErro (b)? 
* [QMErro(a)] + [(K - )QMErro (b)]? 
GLErro(a) GLErro(b) 


QMErro Médio = 


_ ,0011+(2-1).10403 50,67 = 21 (arredondando). 
[1,0011]? R [(2 -1).1,0403]° 


9 12 


Observação: GLErro (a) < n < [GLErro (a) + GLErro (b)]. 


Do Quadro 3 obtém-se: 


“GA? 


SQ Variedade /Linha 1=SQT/T, = 2 +76,4º +82,0? +84/7º) TE 


SQTIT, = 6201,1225 — 6174,0306 = 27,0919; 
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Para o Exemplo 3 a média é: 


Me = 10,7 +12,4+ > 39,7 + 41,2 - 259, 


Propriedades da média: 


i) Somando-se uma constante K a todos os dados, a média (Me) 
também é acrescida de K: 


Me(x +K)=Me(x)+K; 


ii) Multiplicando-se K a todos os dados, a média também é 
multiplicada por K: 


Me(x.K) = K.Me; 
iii) A soma dos desvios (d;'s) em relação a média é zero: 
di = x, —-Me; 


Exemplo 4. Para as N = 3 observações (x;) a seguir, os desvios d; 
em relação a média são: 


Xi di 
3 3-5 =-2 
5 5-5=0 
7 7-5=2 
N 
Média (Me) = 5 Łd = 0 


iv) A média minimiza a soma dos quadrados dos desvios (SQD), ou 
seja, o valor da SQD seria aumentada se colocássemos qualquer 
outro valor que não Me. 


N 2 
SQD =) |x, -Me] . 
1=1 
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Observações: A média é muito influenciada por valores 
discrepantes, extremos. Ela é a medida de posição mais utilizada. 


3.1.2) Mediana (Md) 


É o valor que é precedido e seguido pelo mesmo número de 
observações, em um conjunto de dados ordenados. 


Exemplo 5. Para as N = 5 observações (x;) a seguir, a mediana é: 


X1 X2 X3 X4 X5 


8 9 10 15 40 


Md = 10 (este valor é precedido e seguido por duas observações). 


Observação: Se o número de observações (N) for par, toma-se a 
média dos dois valores centrais. 


Exemplo 6. Para as N = 4 observações (x;) a seguir, a mediana é: 


X1 X2 X3 X4 
9 10 14 20 
Md = Hi =12. 


Propriedades da mediana: 
i) Md (x+K) = Md (x) +K; 
ii) Md (x.K) = K.Md (x); 
iii) A mediana é o valor que minimiza a soma dos módulos dos 
desvios: 
È| x; -a | é mínima se a = Md(x). 


Observação: A Md é uma medida de posição para medidas 
assimétricas. 
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Da análise de variância anterior observa-se que houve diferença 
significativa entre efeitos de Linhas (T^), no comprimento da banana, 
somente para a Variedade 4 (Prob < 0,05). Para as demais 
variedades T;,T> e T3 não houve diferenças significativas (Prob > 
0,05) entre 1 e 2 linhas de irrigação no comprimento do fruto central 
da terceira penca de banana. Podemos então utilizar, por exemplo, 
o teste de Tukey para comparar as médias de T’ (1 e 2 Linhas de 
irrigação) para Tu (Variedade 4). 


Médias: 


Linha 1/ Variedade 4 = TT, = aail 


= 21,18 


Linha 2/ Variedade 4 = T;T, = ce =17,40 


Teste de Tukey: 


DMS = q [QMErro (b) 
T 


sendo q para q=0,05; K = 2 tratamentos secundários (Linhas) e 
GLErro (b) = 12 > q = 3,08: 


DMS = 3,08 


1,0403 =157. 
4 


O contraste entre T, e T, para T4é: 
$ =T, -T,=2118-17,40=3,78. 


3,78 > 1,57 portanto T;+T, para T4. Ou seja, para Variedade 4 (T4), 


1 linha de irrigação (T,) proporcionou significativamente maior 
comprimento (cm) do fruto central da terceira penca de banana do 
que 2 linhas de irrigação (T,). Colocando as letras do teste: 
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SQ T/T, = 2478,4000 — 2478,0800 = 0,3200; 


1 


2 
SQ Linha /Variedade 2 = SQT'/T, = AA +76,4º)- Eco 


8 
SQT/T, = 2918,4800 — 2918,4800 = 0,0000; 


OLD) 


SQLinha / Variedade 3=SQT /T, = 1620? +7972) 


SQT /T, = 3249,1600 — 3248,18 = 0,9800; 


2 
SQLinha / Variedade 4 = SQT’ /T, = ear +69,67)- a 


SQT /T, = 3004,5625 — 2976,0613 = 28,5012. 


Para certificar se o cálculo das somas de quadrados do 
desdobramento Linhas dentro de Variedades foi realizado 
corretamente basta verificar: 


SQ T +SQTx T =SQT/T+SQTIT,+SQT/T,+SQ T'/T, 


11,8828 + 17,9184 = 0,3200 + 0,0000 + 0,9800 + 28,5012. 
29,8012 = 29,8012 ok! 


A análise de variância para o desdobramento T'/T é: 


FV GL SQ QM F Prob>F 
T/T,  (K-1)=2-1=1 0,3200 0,3200 0,308 0,6347 
T/T,  (K-1)=2-1=1 0,0000 0,0000 0,000 0,9975 
T/T,  (K-1)=2-1=1 0,9800 0,9800 0,942 0,4341 
T/T, (K-1)=2-4=1 28,5012 28,5012 27,397 0,0346 


Erro (b) 12 12,4838 1,0403 
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3.1.3) Moda (Mo) 
É o valor mais freqüente no conjunto de dados. 
Exemplo 7. Para as N = 5 observações (x;) a seguir, a moda é: 


X1 X2 X3 X4 X5 


8 9 9 12 18 


Mo = 9 (valor mais freqüente; apareceu duas vezes no conjunto de 
dados). 


Propriedades da moda: 
i) Mo (x+K) = Mo (x) +K; 
ii) Mo (x.K) = K.Mo (x). 


Observações: A Mo também é uma medida de posição para 
medidas assimétricas. Ela é ainda menos afetada por valores 
extremos do que a mediana. Para variáveis contínuas, onde é difícil 
encontrar um mesmo valor repetido duas ou mais vezes, a moda é 
calculada de outra maneira, através do denominado método de 
Czuber; porém, tal método não será discutido neste material. 


3.2) Medidas de dispersão 


Definição: grandeza numérica que descreve a variabilidade em um 
conjunto de dados. 


3.2.1) Amplitude (A) 
A = MVO - mvo 


Trata-se da diferença entre o maior valor observado (MVO) e o 
menor valor observado (mvo) como já foi visto anteriormente. 
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Exemplo 8. Considere dois conjuntos de dados (X e Y) medidos em 
metro (m): 


Totais 
X 6 16 16 16 41 95 
Y 6 11 21 31 41 110 


A (X) = 41 - 6 = 35; 
A(Y)=41-6=35. 
X e Y apresentam mesma amplitude (A), portanto o conjunto X 


apresenta claramente menor variabilidade (maior uniformidade) que 
o conjunto Y. 


Observação: A amplitude é muito influenciada por valores extremos, 
uma vez que é calculada a partir deles. Assim, a medida que 
aumenta N, aumenta a chance de encontrar valores extremos, 
aumentando, portanto, a amplitude. 


3.2.2) Variância (Var) e Desvio padrão (DP) 


São medidas baseadas em todos os dados, a partir dos desvios em 
relação a média. 


e Variância (Var ou o°): média dos quadrados dos desvios 
(também chamada de quadrado médio), cuja expressão é 


dada por: 
N 2 n 2 
k; — Me] Dx, — Me] 
Gi = (população) ou ô? ad PT (amostra). 
Eus 
Ou ainda, pelas expressões alternativas: 
N É n i 
Lx; Lx; 
pareça px) tis 
op- ~ N (população) ou ô? -= Soon (amostra). 
i 
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|-1,5|=1,5 < 1,56 portanto T = T, e assim continua as 


comparações entre as outras médias de variedades duas a duas. 


b) Comparações entre médias de tratamentos secundários (médias 


' 


de Linhas - T ): 


Comparando a média de T, com a de T, pelo teste de Tukey, do 
Quadro 3 pode-se obter: 
= _ In 3143 = _ Tu _ 2948 


T, = =19,64 e L=— 
rI 4x4 rI 4x4 


DMS =q QMiro (b) 
r. 


sendo q para 0=0,05; K = 2 tratamentos secundários (Linhas) e 
GLErro (b) = 12 > q= 3,08: 


= 18,43 


1,0403 


DMS = 3,08 = 0,78 


O contraste entre T, e T, é: 
$ =T, -T,=19,64-18,43=121. 
1,21 >0,78 portanto TzT,. 


c) Comparações entre médias de tratamentos secundários dentro de 
cada nível de tratamento principal (médias de Linhas dentro de cada 


Variedade - T/T): 
Do Quadro 3 obtém-se: 


2 
SQ Linha /Variedade 1 = SQ T'/T, = 2 +69,6? )- UoD 
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T 


Ti 
secundário i , respectivamente. 


e Tẹ: total do tratamento principal i e do tratamento 


T, e T: média do tratamento principal i e do tratamento 
secundário i , respectivamente. 


As comparações de médias que o pesquisador pode ter interesse 
em um experimento em parcelas subdivididas são as seguintes: 


a) Comparações entre médias de tratamentos principais (médias de 
Variedades - T): 


Comparando, por exemplo, a média de T; com a de Tz pelo teste de 
Tukey, do Quadro 3 pode-se obter: 


— |: ER | 
T, pg Si da 140,8 =17,6 € T= Do = 152,8 =191 
rK 4x2 rK 4x2 
DMS = q |QMErro (a) 
r.K 
sendo q para &=0,05; | = 4 tratamentos principais (Variedades) e 
GLErro (a) =9 > q= 4,41: 
DMS = 4,41 BOVLI =1,56. 


O contraste entre T, e T, é: 


$=T-T,=17,6-191=-15. 
Lembrando a interpretação do teste Tukey: 


Se | ş |> DMS = as médias dos dois tratamentos em comparação 
podem ser consideradas estatisticamente diferentes. 


80 


e Desvio padrão (DP ou o): é a raiz quadrada da variância, 
cuja expressão é dada por: 


o=o (população) ou =V (amostra). 


Observações: Quanto maior o? ou 6”, maior a variabilidade do 
conjunto de dados. O DP tem a vantagem, em relação a Var, de 
possuir a mesma unidade dos dados (por exemplo, se a unidade de 
medida dos dados é kg, a do DP também será kg enquanto que a 
da Var será kg”), facilitando, assim, a visualização do quanto, em 
média, os dados se desviam da média. 


Para o Exemplo 8 tem-se: 


95)? 
EG sera E 
110)? 

erityi 442 IO 


DP(X) = 136 =11,66 m; 
DP(Y) = V164=1281 m. 


Propriedades da variância e do desvio padrão: 
i) Somado-se uma constante K a todos os dados, a Var e o DP não 
se alteram: 

Var(x + K) = Var(x); 

DP(x + K) = DP(x); 
ii) Multiplicando-se K a todos os dados, a Var fica multiplicada por K? 
eo DP pork. 

Var(x.K) = K[Var(x)]; 

DP (x.K) = K [DP (x)]; 
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iii) O DP em relação a média é mínimo ao invés de qualquer outro 
valor devido ao fato da média ser o valor que torna mínima a soma 
de quadrados do desvio (SQD). 


3.2.3) Coeficiente de Variação (CV) 
CV(%) = ie hoo É 
Me 


O CV é uma medida relativa, porcentual, pois o desvio e a média 
possuem a mesma unidade. 


Exemplo 9. Considere os pesos (Kg) de animais de dois rebanhos 
diferentes: 


FV GL SQ QM F Prob>F 
Bloco 3 15,7535 5,2512 5,245 0,0229 
Variedades (T) 3 26,9635 8,9878 8,978 0,0045 
Erro (a) 9 9,0102 1,0011 
Parcelas 15 51,7272 
Linhas ( T' ) 1 11,8828 11,8828 11,422 0,0055 
Tx T' 3 17,9184 5,9728 5,741 0,0338 
Erro (b) 12 12,4838 1,0403 
Total 31 94,0122 


cv (a) (%) 5,26 


CV (b) (%) 5,37 


Média geral (y) : 19,0 Número de observações: 32 


Rebanho A Rebanho B 
70 490 
90 510 
80 480 
100 500 
Me 85 495 
DP 11,18 11,18 


É claro que pelos valores de pesos tratam-se de rebanhos de idades 
diferentes. Os rebanhos A e B possuem o mesmo DP, porém, é 
óbvio que diferenças de 5 kg, por exemplo, possuem um peso 
relativo muito maior no rebanho A do que no rebanho B. Assim, 
poderíamos afirmar que a variabilidade do rebanho A é maior do 
que a do rebanho B. Isto pode ser comprovado pelos valores de CV 
dos dois rebanhos: 


CV (Rebanho A): x 100= 13,15%; 


11,18 
85 


CV (Rebanho B): TS x 100 = 2,26% - 
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Nos experimentos em parcelas subdivididas tem-se dois 
coeficientes de variação (CV): 


Para parcelas: 


JOME zA 
rap Oo e 0-1 100 =5,26%: 


Para subparcelas: 


“OMErro(b JL04 
cy) = MET) (og AA Top =537%. 
y i 


Considere: 

|: número de tratamentos principais, | = 4 variedades; 

K: número de tratamentos secundários, K = 2 linhas de irrigação; 
r: número de blocos, r = 4 blocos; 
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SQ Parcelas = 11645,5650-11593,8378 = 51,7272; 


SQ Erro (a) = SQ Parcelas — SQ Blocos — SQ Variedades 
SQ Erro (a) = 51,7272 — 15,7535 — 26,9635 = 9,0102. 


É necessário também fazer um outro quadro auxiliar com a 
combinação entre os níveis dos dois fatores (variedades e linhas de 
irrigação) para o cálculo da soma de quadrados do tratamento da 
subparcela (linhas de irrigação) e da interação variedades x linha 
(T xT’). 


Quadro 3. Quadro auxiliar com os totais de todas as repetições para 
cada combinação entre os níveis dos fatores T e T”. 


Linhas\Variedades Tı T2 Ts Ta Totais 
T, 71,2 © 76,4 82,0 84,7 314,306) 

È 69,6 76,4 79,2 69,6 294,8 

Totais 140,88) 152,8 161,2 154,3 609,1 


Do Quadro 3 é possível obter: 
SQ Linhas = EIA +294,8°) -11593,8378 


SQ Linhas = 11605,7206 — 11593,8378 = 11,8828; 


SQ Variedadesx Linhas (T x T`) = a 1,27 +69,6? +...+ 69,67) - C — SQ Variedades- SQLinhas 


SQ Variedades x Linhas (T x T) = 11650,6025 — 11593,8378 — 26,9635 — 
11,8828 = 17,9184; 


SQ Erro (b) = SQ Total — SQ Parcela — SQ Linhas — SQ Variedades x 
Linhas 


SQ Erro (b) = 94,0122 — 51,7272 — 11,8828 — 17,9184 = 12,4838. 


E o quadro de análise de variância para os dados do exemplo 5.6.5) 
conforme o esquema em parcela subdividida é: 
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Observação: O CV por ser adimensional é útil na comparação entre 
conjuntos de dados com mesma unidade mas permite, também, a 
comparação da variabilidade entre conjuntos de dados referentes a 
diferentes características. 


3.3) Medidas de assimetria e curtose 


Em estatística, freqüentemente é interessante saber se a população 
da qual a amostra foi coletada pode ser descrita por uma curva 
normal. Isso pode ser verificado por meio das seguintes medidas: 


3.3.1) Coeficiente de assimetria (As): medida que quantifica o 
distanciamento de um conjunto de dados em relação à simetria. O 
coeficiente As é dado por: 


As = —— = — 
Pa d? 
L(x -x) 2 2 Da g 5 
sendo m, ==——— e df = o (variância populacional) ou 


n 
6” (variância amostral). 


positivo(As > 0): indica uma assimetria à direita, 
Se As é negativo(As <0):indica uma assimetria à esquerda, 
e As é 
zero (As =0): indica uma simetria(amostra pode ser considerada vinda de uma 


distribuição normal). 


Na Figura 6 pode ser visto a natureza do comportamento de uma 
variável, se simétrica, assimétrica à direita ou assimétrica à 
esquerda. 


Observação: Na prática os valores de As dificilmente serão zero, 
podendo ser próximos de zero. 


3.3.2) Coeficiente de curtose (K): medida que quantifica o grau de 
achatamento da distribuição de frequência de um conjunto de 
dados, tendo a curva normal como referência. O coeficiente K é 
dado por: 
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_ M, _ M, 
“dd d 
a —4 
L(x;—*) 2 2 Ani i 
sendo m == Hed = o (variância populacional) ou 
4 
n 


ô’ (variância amostral). 


> 3: indica uma distribuição afiada chamada leptocúrtica, 
Se K é4< 3: indica uma distribuição achatada chamada platicúrtica, 


=3: indica uma distribuição semelhante a normal chamada mesocúrtica. 


dar Leptocúrtica 
j 
j 
” 
Mesocúrtica 
À, 


"af 


Aninha ipiaiinispaiieieia 
den petite pede + e 


f l N Platicúrtica 
f / 
/ J] A 
/ He "e N 
SEA = so Rs. 


Figura 7. Gráfico dos diferentes graus de achatamento relativos a uma distribuição de 
frequência 


Exemplo 10. Seja as seguintes N = 4 observações, a média (x) e a 
variância (d?/destas observações dadas por 


Considerando que a unidade de cálculo é a subparcela, do Quadro 
de dados podemos tirar: 


— (609.1)? 
E 2 


C = 11593,8378; 


SQ Blocos -5156,4 +155,1? +142,6º +155,0°) — 11593,8378 


SQ Blocos = 11609,5913 — 11593,8378 = 15,7535; 
SQ Total = 19,0 + 17,1? + . . . + 16,4? + 18,6° — 11593,8378 
SQ Total = 11687,8500- 11593,8378 = 94,0122. 


Para o cálculo da soma de quadrados de parcelas, é necessário 
fazer um quadro auxiliar com os totais das parcelas. 


Quadro 2. Quadro auxiliar com os totais das parcelas 


Repetições Tratamentos Totais 
Tı T2 Ts Ta 
1 37,9 Ø 39,0 41,5 38,0 156,4 (8) 
2 34,7 37,8 42,2 40,4 155,1 
3 324 36,8 36,0 374 142,6 
4 35,8 39,2 41,5 38,5 155,0 
Totais 140,86) 152,8 161,2 154,3 609,1 


Xı X2 X3 X4 x d2 


2 15 16 17 12,5 37,25 


Do Quadro 2 calculamos: 

. 1 
SQ Variedades = q 1408" +152,8º +161,2?2 +154,3°) -11593,8378 
SQ Variedades = 11620,8013 — 11593,8378 = 26,9635; 


SQ Parcelas= 1679 +34,7’? +...+37,4° +38,5°)-11593,838 


77 


fruto central da terceira penca de banana estão dispostos na Tabela 
8 a seguir. 


Tabela 8. Comprimento (cm) do fruto central da terceira penca de 
banana para um experimento em blocos casualizados (DBC), com 4 
repetições, em esquema de parcela subdividida com 4 variedades 


de banana (T;, T2, Ts e T4) nas parcelas e 2 linhas de irrigação (T, = 
1 linha e T,= 2 linhas) nas subparcelas 


Tratamentos 


Repetições Tı To Ts Tu Totais 
T TT T TFT TTT 7r 


1 19,0 189 192 198 208 20,7 211 16,9 1564 
2 171 17,6 195 183 209 213 227 17,7 1551 
3 17,5 14,9 175 193 186 174 210 164 1426 
4 17,6 182 202 190 217 198 199 186 1550 
Totais 71,2 69,6 764 764 820 792 847 69,6 6091 


5.6.6) Croqui de campo 


T2 T4 T Ts 

BL | TÍT ITITIÍTIÍTIÍTIĪIT, 
Ts T T2 T4 

BL II Tol T DAS E A E 
T4 Ts T T2 

BL II TT ER. E ES AR 
Tı T2 Ts T4 

BL IV TÍT ITITLTIÍCITITIT 
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_ (2-12,5) +(15-12,5)° +(16-12,5) +(17—12,5)° _ —1008 _ 


m; =-252; 
i 4 4 

t 4 E 4 = 4 ek 4 

= (2=12,5)º +015= 12,5)" + (16-12,5)º + (17 —12,5)* 1275425 _ 3188563: 
4 
—252 m ; ; ; 

As= =— = 1,108 (As < 0 — Assimetria a esquerda); 

3725/3725 d 

3188,563 


=230 (K < 3 — Distribuição platicúrtica). 


(37,25) (37,25) 


4) Testes de comparações múltiplas 


4.1) Contrastes ortogonais de médias 
Definição: São combinações lineares dadas por: 
Yı = am, + amo + ..+ am, 


Yə = bim; + bəmə Pat Damn 


Yi = CM, + C2M2 + ...+ CM 


sendo a soma dos coeficientes de cada contraste igual a zero: 


em que: 
a1, D1, C1, ---, ân, Dn; Cn SãO OS coeficientes dos contrastes; 


my, M2, ..., m são médias dos tratamentos 1, 2, ...,n. 


Dois contrastes são ditos ortogonais quando há uma independência 
entre suas comparações, ou melhor, quando a variação de um 
contraste é independente da variação do outro. A exigência para 
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que dois contrates sejam ortogonais é que a covariância (Cov) entre 
eles seja nula: 


Cov(Y,, Y,)=0. 


Seja s? a variância do tratamento i e r; o número de repetições do 


tratamento i, a covariância entre dois contrastes é dada por uma das 
seguintes expressões: 


. Se sizsja.ts e A oa: 
a ab, a,b a,b a,b 
Cov(Y1, Y2) = } =s? = Hg? 22 s} tee H Hg, 
r, É r, r, 
. Se S/=8)=...=8) e HIEI: 
nab, ab, a,b a,b 
Cov(Y4, Yo) = Z += ly 202 4... 4 non 
lr, o É r, 
2 2 2 . 
+ SOS =8;=..=8, © h=[2=...=: 


Cov(Y, Yə) = Lab =ab +a,b,++a,b,. 
ial 
A variância (Var) de um contraste Y é: 
Var (Y) = s’ F Č (se s? =s2=...=s2=8°) 


ou 


N 


C. 
Var (Y) = Y “is? (se slzsiz..*s)). 
i=l T. 


1 


O erro padrão do contraste Y é: 


s(Y) = JVar(Y) . 
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5.6.3) Desvantagem 


Há uma redução do número de graus de liberdade do erro, 
comparativamente ao esquema fatorial, redução esta decorrente da 
existência de dois erros, o erro (a) referente às parcelas e o erro (b), 
correspondente às subparcelas dentro das parcelas. 


5.6.4) Modelo estatístico do experimento em parcela 
subdividida 


O modelo a seguir corresponde a um modelo de um DBC em 
esquema de parcela subdividida: 


Y ijk =ì +B, + O, +ô; + Vr + (AY) + Cik 


em que y; é o valor observado referente a parcela que recebeu o i- 


ésimo nível do tratamento principal œ e o k-ésimo nível do 
tratamento secundário y no j-ésimo bloco; u representa uma 
constante geral associada a esta variável aleatória; Bj é o efeito do j- 
ésimo bloco; œ; é o efeito do i-ésimo nível do tratamento principal; ô; 
= (ob); é o efeito residual das parcelas, caracterizado como 
componente do erro (a); y é o efeito do k-ésimo nível do tratamento 
secundário; (oy)j é o efeito da interação do i-ésimo nível do 
tratamento principal œ com o k-ésimo nível do tratamento secundário 
y e ejk representa o efeito residual das subparcelas, caracterizado 
como componente do erro (b). 


Sobre as distribuições de à; e ejk pode-se considerar as seguintes 
pressuposições: i) & ^ N(0, o$); ii) e^ N(0, o”); iii) &j e e; são 
não correlacionados. 

5.6.5) Exemplo de parcela subdividida 


Foi realizado um experimento em blocos casualizados com 4 
repetições, no esquema de parcelas subdivididas. Os tratamentos 
das parcelas foram 4 variedades de banana (T4, T2, T3 e T4) e os 
tratamentos das subparcelas foram uma e duas linhas de irrigação 


(T, = 1 linha e T,= 2 linhas). Os dados do comprimento (cm) do 
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5.6) Experimentos em parcelas subdivididas 
5.6.1) Características 


O esquema experimental em parcelas subdivididas se caracteriza 
como sendo uma variação do experimento fatorial com dois fatores 
(Steel et al., 1997). A principal característica destes experimentos é 
que as parcelas são divididas em subparcelas. Os tratamentos das 
parcelas são chamados de primários ou principais e são dispostos 
segundo um tipo qualquer de delineamento, sendo os mais usados 
os delineamentos em blocos casualizados, com o objetivo de 
procurar controlar a variabilidade que possa haver no material 
experimental. Os tratamentos das subparcelas são chamados 
secundários e são dispostos aleatoriamente dentro de cada parcela. 
Assim, cada parcela funciona como um bloco para os tratamentos 
secundários. Primeiro casualizam-se os níveis do fator primário nas 
parcelas de cada bloco; em seguida, casualizam-se os níveis do 
fator secundário nas subparcelas de cada parcela. Pimentel Gomes 
(1990) e Hinkelmann & Kempthorne (1994), dentre outros autores, 
são unânimes em afirmar a maior precisão existente no teste de 
tratamentos secundários. 


5.6.2) Vantagens 


Os experimentos em parcelas subdivididas apresentam uma grande 
utilidade na pesquisa agropecuária, além de outras diversas áreas. 


Tais experimentos são úteis em situações como: a) quando os 
níveis de um dos fatores exigem grandes quantidades de material 
experimental (por exemplo, níveis de irrigação), devendo ser 
casualizados nas parcelas; b) quando informações prévias 
asseguram que as diferenças entre os níveis de um dos fatores são 
maiores que as do outro fator; c) quando se deseja maior precisão 
para comparações entre níveis de um dos fatores; d) quando existe 
um fator de maior importância (que deverá ser casualizado na 
subparcela) e outro de importância secundária, sendo este incluído 
para aumentar a extensão dos resultados e e) nas situações 
práticas, onde é difícil a instalação do experimento no esquema 
fatorial. 
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Observações: Em um experimento com | tratamentos, o número 
máximo de contrastes ortogonais possíveis é dado por 1-1 
comparações. Os contraste são formulados de acordo com o 
interesse do pesquisador. 


Exemplo 11. Considere as médias de produtividade de grãos (t/ha) 
de 4 cultivares de milho: 


Ñ, =5,2 
Ñ, =33 
Ñ, = 4,0 
ñ, =9,0 


lapit i 


n=r2=r3=r4=5 e si=s;=S;=s;=s"= 0,19. 


i) Escolher os (l-1) = 4-1 = 3 contrastes: 
Y1 = mM; + M2 — M3 — M4 em que aı=1, a2=1, a3= -1, a4= -1 
Yə = mı- M2 em que aı=1, a2= -1, a3= 0, a4= 0 


Y3 = M3 — M4 em que a= 0, a2= 0, a3= 1, a4= -1. 


ii) Verificar se o somatório dos coeficientes de cada contraste é igual 
a zero: 


4 

Y, > Ła;=1+1-1-1=0 
if 
4 

Y, > Èb, =1-1+0+0=0 
i=1 


4 
Y, > $c; =0+0+1-1=0. 
i=l 
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iii) Verificar se a covariância entre dois contrastes é igual a zero: 


Côv(Y,, Y,) = Lad, =1.1+1.(—1) + (—1).0 + (—1).0 =0 
i=1 
A A 4 
Côv(Y,. Y3) = La,c,=1.0+1.0+(-DI+(-D(-1) =0 
j=l 


Al i 4 
Côv(Y,. Y,) = L be, =1.0+(-1).0+0.1+0(-1) = 0. 
i=1 


iv) Calcular a variância de cada contraste: 


2 o E T E E e 
Vâår(Î,) = 2$ - 019] DD) |roaseo 
i1 N, 5 
2 A E O T 
Var li - oaf? LCD TO |rosro 
izi f 5 
2 E VE OA E 
Vâår(Ŷ,) = PE = oas? 2 < A |rooro 
1=1 r; 


v) Calcular o erro padrão de cada contraste: 
s(Ŷ,) = 4/ Vâr(Ẹ,) = 40,1520 = 0,3899 t/ha 
s(Y,)=4/Vár(Y,) = 0,0760 = 0,2757 t/ha 
s(Ê,) = 4| Vâr(f,) = /0,0760 = 0,2757 t'ha. 


vi) Calcular as estimativas destes contrastes: 


A 


Y,=5,2+3,3-4,0-9,0 = -4,5 t/ha 


A 


Ê, =5,2-3,3 = 1,9 t/ha 


A 


Y,=40-9,0 = -5,0 t/ha. 
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Aplicando o teste de Scott-Knott para variedades dentro de cada 
nível de inoculante tem-se: 


- Variedade dentro do inoculante 1: 


Variedade Médias Resultado do teste 
1 231,4 b 
2 385,3 a 


A variedade 2 apresentou peso do colmo estatisticamente superior 
ao da variedade 1 quando foi utilizado o inoculante 1 (Prob<0,05). 


- Variedade dentro do inoculante 2: 


Variedade Médias Resultado do teste 
1 209,0 b 
2 374,8 a 


A variedade 2 apresentou peso do colmo estatisticamente superior 
ao da variedade 1 quando foi utilizado o inoculante 2 (Prob<0,05). 


- Variedade dentro do inoculante 3: 


Variedade Médias Resultado do teste 
1 244,3 b 
2 379,3 a 


A variedade 2 também apresentou peso do colmo estatisticamente 
superior ao da variedade 1 quando foi utilizado o inoculante 3 
(Prob<0,05). 
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- Inoculante dentro da variedade 2: 


Inoculantes Médias Resultado do teste 
1 385,3 a 
2 374,8 a 
3 379,3 a 


Também não houve diferenças significativas (Prob>0,05) com 
relação ao peso do colmo entre os 3 inoculantes utilizados para a 
variedade 2. 


b) Estudar o comportamento das variedades para cada inoculante 
Do Quadro 1 tem-se: 


1 2466,4)? 
SQ Variedade / = TOSA +1541,0?) — gar = 47370,4200 
1 2334,8)? 
SQ Variedade / = q (838º +1499,0º) -2a = 54979,2800 
1 2494,2)? 
SQ Variedade / l3 = q TU +1517,1”) -S = 36450,0000. 
FV GL SQ QM F Prob>F 
Variedade / l1 1 41370,4200 41370,4200 25,700 0,0001 
Variedade / l2 1 54979,2800 54979,2800 29,828 0,0001 
Variedade / l3 1 36450,0000 36450,0000 19,775 0,0005 
Erro 15 27648,1067 1843,2071 


Neste segundo desdobramento da interação (variedade dentro de 
inoculante) conclui-se que as duas variedades apresentaram pesos 
de colmos diferentes (Prob<0,05) para cada inoculante utilizado (l4 
ou lə ou l3). 
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vii) Conclusões dos contrates: 
m +m, m+m, 
2 


O contraste Y4 nos indica que o grupo das cultivares 1 e 2 produz 
em média 2,25 t/ha a menos que o grupo das cultivares 3 e 4. 


a) Ŷ = =-2,25 t/ha 


b) $= 21,9tha 

1 1 
O contraste Yə nos indica que a cultivar 1 superou em média a 
produção da cultivar 2 em 1,9 t/ha. 
o) Y=D2 De = soyha. 

1 1 
O contraste Y3 nos indica que a cultivar 3 produziu em média 5,0 
t/ha a menos que a cultivar 4. 


4.2) Teste t de Student 
4.2.1) Teste t para contrastes ortogonais 
Considerações: 


- O teste t pode ser usado para contrastes ortogonais, sugeridos 
pela estrutura dos tratamentos. 


- De acordo com Banzatto & Kronka (1989), deve-se escolher os 
contrastes antes de avaliar os dados ou, se possível, na fase de 
planejamento do experimento para evitar que sejam escolhidos 
contrastes correspondentes as maiores diferenças observadas entre 
médias, o que aumentaria, assim, a probabilidade de erro tipo I (ot). 
O a consiste no erro que se comete ao rejeitar Ho, sendo que ela é 
verdadeira. 


Dada uma hipótese de nulidade (Ho) e sua hipótese alternativa (H1) 
dada por: 
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Ho: Y= 0, ou seja, as médias ou grupos de médias comparadas no 
contraste não diferem entre si. 


Hı: Yz 0, ou seja, pelo menos uma média difere das demais ou um 
grupo de médias difere de outro grupo. 


A estatística t é calculada por: 


sendo Y a estimativa do contraste de interesse e s(Y) a estimativa 
do erro padrão do contraste. 


A estatística t é comparada (em valor absoluto) com um valor 
tabelado (t), procurando-se na Tabela de t (encontrada em livros de 
estatística) o número de graus de liberdade (GL) associado a 
variância e o nível de significância œ. Se It |< t, aceita-se a 
hipótese H, e conclui-se que as médias ou os grupos de médias em 
comparação são iguais; caso contrário, se t [> t rejeita-se a 
hipótese Hə e conclui-se que as médias ou o grupo de médias em 
comparação são diferentes. 


Exemplo 12. Aplicar o teste t nos contrates Y4, Y> e Y3 do Exemplo 
11, considerando que o GLErro da análise de variância é 16. 


Yı = M; + M2 — M; — M, Y,=-45t'ha  s(Ẹ,) = 0,3899 t/ha 
Y2 = mı- m? Y, =1,9 tha s(,)= 0,2757 t/ha 
Y3 = M — m, Y, = -5 t/ha s(Y,) = 0,2757 t/ha 


- Teste t para Y,: 


Dgs SPO Aai 
P 0,3899 


t para a=0,05 e GL Erro=16 = ty) =2,12 
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variedades e inoculantes, recomenda-se proceder o desdobramento 
da interação V x | para certificar tal informação. 


O desdobramento, no caso deste exemplo com dois fatores, pode 
ser realizado das seguintes maneiras: 


a) Estudar o comportamento dos inoculantes para cada variedade 
Do Quadro 1 tem-se: 


2 
SQ Inoculante / V,= 1025,4? +835,8° +977,1°) (7383) 2555,5617; 
4 12 
2 
SQ Inoculante / Vz = S (15410? +1499,0º +1517,1º) SER 221,9017. 
FV GL SQ QM F Prob>F 
Inoculante / Vi 2 2555,5617 1277,7808 0,693 0,5110 
Inoculante / V2 2 221,9017 110,9508 0,060 0,9427 


Erro 15 27648,1067 1843,2071 


Neste primeiro desdobramento da interação (inoculante dentro de 
variedade) conclui-se que tanto para variedade 1 quanto para a 
variedade 2, não há diferença significativa (Prob>0,05) no peso do 
colmo entre os três inoculantes aplicados. 


Aplicando o teste de Scott-Knott para inoculantes dentro de cada 
nível de variedade tem-se: 


- Inoculante dentro da variedade 1: 


Inoculantes Médias Resultado do teste 
1 231,4 a 
2 209,0 a 
3 244,3 a 


Realmente, não houve diferenças significativas (Prob>0,05) com 
relação ao peso do colmo entre os 3 inoculantes utilizados para a 
variedade 1. 
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SQ Variedades x Inoculantes = 140612,1900 - 137834,7267- 1812,4900 = 
964,9733. 


E o quadro de análise de variância para os dados do exemplo 5.5.5) 
conforme o esquema fatorial 3x2 é: 


FV GL SQ QM F Prob>F 
Bloco 3 3806,8083 1268,9361 0,688 0,5730 
(Tratamentos) (5) (140612,1900) 28122,4380 15,257 0,0000 
Variedades (V) 1 137834,7267 137834,7267 74,780 0,0000 
Inoculantes (1) 2 1812,4900 906,2450 0,492 0,6211 
VxI 2 964,9733 482,4867 0,262 0,7731 
Erro 15 27648,1067 1843,2071 

Total 23 172067,1050 

CV (%)= 14,12 

Média geral: 303,98 Número de observações: 24 


Aplicando o teste de Scott-Knott para variedades (pois esta fonte de 
variação foi significativa: Prob<0,05) tem-se: 


Variedades Médias Resultado do teste 
1 228,2 b 
2 379,8 a 


Aplicando o teste de Scott-Knott para inoculantes, apesar de seu 
efeito ter sido não significativo (Prob>0,05), tem-se: 


Inoculantes Médias Resultado do teste 
1 308,3 a 
2 291,8 a 
3 311,8 a 


Embora a interação V x | não seja significativa (Prob > 0,05), 
indicando não haver uma dependência entre os efeitos dos fatores 
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Como | tey) |> ty > |-11,541| >2,12 = rejeita-se Ho: Yı = 0 e 


portanto m;+ M2 + ms + my (os dois grupos de médias de cultivares 
diferem entre si ao nível de 5% de significância) 


- Teste t para Y2: 
_ 1,9-0 
O 0,2757 


= 6,892 


tv, para 4=0,05 e GL Erro=16 = t) =212 


Como| tay [> tur, = 6,892 > 2,12 = rejeita-se Ho: Y2 = 0 e 


portanto m; + m> (a média da cultivar 1 difere da cultivar 2 ao nível 
de 5% de significância) 


- Teste t para Y3: 
-5,0—0 


to = =18,136 
e 0,2757 


tvs) para a=0,05 e GL Erro=16 => ty =2,12 


Como| tav, = |> tiva = 18,136 > 2,12 = rejeita-se Ho: Ys = 0 e 


portanto ms + my (a média da cultivar 3 difere da cultivar 4 ao nível 
de 5% de significância). 


4.2.2) Teste t para comparação de duas médias 
Passos para realização do teste: 
i) Definir a hipótese de nulidade: Ho: y,=y,; 


ii) Estabelecer o nível de significância (o); 
iii) Calcular a média de cada grupo (y,); 


iv) Calcular a variância de cada grupo (s?) ; 
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v) Calcular a variância ponderada So por meio da expressão: 


> (ny -Dsi+(n,-Ds$. 
Sp = 


, 


ny +n, -2 
vi) Calcular a estatística t, por meio da expressão: 


Yı-y2 


vii) Encontrar o valor Tabelado de t (t) procurando na Tabela de t o 
valor correspondente a combinação entre o nível de significância 
estabelecido, a, e o grau de liberdade (GL) dado por n; + no —2; 


viii) Concluir o resultado do teste: 


Se |t |< t, aceita-se a hipótese H, e conclui-se que as duas médias 
em comparação são iguais; 


Se |t |>t, rejeita-se a hipótese H, e conclui-se que as duas médias 
em comparação são diferentes. 


Exemplo 13. Foi avaliado o volume estimado (em m/ha) de 
madeira produzida por 2 espécies de eucalipto. Verifique se há 
diferença entre as médias das 2 espécies por meio do teste t. 


Espécie Volume (mº/ha) 
1 24 

26 

29 

32 

38 

60 

63 

71 
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SQ Bloco = (819,5 +1941,7” +1802,4º +1731,8º) — 2217619,2150 


SQ Bloco = 2221426,0233 — 2217619,2150 = 3806,8088. 

SQ Tratamento = 10254 +835,8º +977,1? +1541,0º +1499,0º +1517,1) — 2217619,2150 
SQ Tratamento = 2358231,4050 — 2217619,2150 = 140612,1900. 

SQ Total = 238,1 + 223,6? +... + 298,4° + 363,8? — 2217619,2150 

SQ Total = 2389686,3200 — 2217619,2150 = 172067,1050. 

SQ Erro = 172067,1050 — 3806,8083 — 140612,1900 = 27648,1067. 


Deve-se montar um quadro auxiliar com os totais de todas as 
repetições para cada combinação entre os níveis dos fatores. 


Quadro 1. Quadro auxiliar com os totais de todas as repetições para 
cada combinação entre os níveis dos fatores. 


l1 l2 Ia Totais 
Vi 925,4 (4) 835,8 977,1 2738,3 (12 
V2 1541,0 1499,0 1517,1 4557,1 
Totais 2466,4 (8) 2334,8 2494,2 7295,4 


0 os valores dentro de parênteses correspondem ao número de parcelas que deu origem a cada total. 
Do Quadro 1 obtém-se: 

SQ Variedades = (2783 + 4557,1”) — 2217619,2150 

SQ Variedades = 23554583,9417 — 2217619,2150 = 137834,7267. 


SQ Inoculantes = Z 2466,4" + 2334,8? + 2494,2?) — 2217619,2150 


SQ Inoculantes = 2219431,7050- 2217619,2150 = 1812,4900. 


SQ Variedades x Inoculantes = [SQ V, I —- C] — SQ Variedades — SQ 
Inoculantes 


SQ Variedades x Inoculantes = È (925,4? +- +1517,1°) 22176192150] —137834,7267 — 1812,4900 
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peso do colmo (ton/ha). Os dados estão apresentados na Tabela 7 a 
seguir. 


Tabela 7. Peso do colmo (ton/ha) para os 6 tratamentos de um 
experimento em blocos casualizados (DBC), com 4 repetições, em 
esquema fatorial 2x3 


Repetições 
Tratamentos Totais 
1 2 3 4 

1-Vil 238,1 256,0 267,1 163,6 925,4 
2 — Vilz 223,6 217,0 184,7 210,5 835,8 
3 — Vala 286,8 205,8 231,6 252,9 977,1 
4- Val 347,5 403,9 347,0 442,6 1541,0 
5 — Vil 351,2 452,5 396,9 298,4 1499,0 
6 — Vala 372,3 406,5 374,5 363,8 1517,1 
Totais 1819,5 1941,7 1802,4 1731,8 7295,4 
5.5.6) Croqui de campo 

BLI 2 4 1 3 6 5 

BL II 5 2 6 1 4 3 

BL III 3 4 5 2 1 6 

BL IV 6 1 3 4 5 2 


Assim, os valores das somas de quadrados para o exemplo 5.5.5) 
são: 


(1295,4)? 


C = 2217619,2150. 
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i) Hipótese de nulidade: Ho: y,=y,; 
ii) 0=0,05; 

iii) y, =29,80 e y, =64,67; 

iv) s? =30,20 e s;=32,33; 

jj s? = (5—1).30,20+(3—1).32,33 
lá 5+3-2 

29,80 — 64,67 


ad PI l 
“+ Bo91 


vii) ta, para 0=0,05 eGL=5+3-2=6 > t,2)=2,447; 


viii) Comparando a média da espécie 1 com a média da espécie 2 
de eucalipto: 


= 30,91; 


vi) t = 8,588; 


| ta,2) |> tia,2) 


|-8,588|= 8,588 > 2,447 = Rejeita-se Ho > Portantoy,+ y, (a 
média da espécie 1 de eucalipto difere da média da espécie 2 de 
eucalipto ao nível de 5% de probabilidade). 


4.2.3) Teste t para comparação de duas médias em uma análise 
de variância 


A diferença mínima significante (DMS ou LSD-Least Significant 
Difference) entre duas médias pelo teste t de é dada por: 


r 


em que t; é o valor de t tabelado, o qual corresponde o valor obtido 
da combinação entre o nível de significância estabelecido (o) eo 
grau de liberdade do erro (GLE) da análise de variância, na Tabela 
unilateral de t. O QME é o quadrado médio do erro da análise de 
variância e r é o número de repetições de cada tratamento. 
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Quando o valor absoluto da diferença entre duas médias for igual ou 
maior que a DMS, as médias podem ser consideradas 
estatisticamente diferentes. 


Exemplo 14. Foi realizada a análise de variância para os dados de 
porcentagem de absorção de água de 5 linhagens de feijão, com 3 
repetições por linhagem. O valor do grau de liberdade do erro (GLE) 
foi 10 e o quadrado médio do erro (QME) foi 4,08. Compare as 
médias dos tratamentos a seguir pelo teste t: 


y= 95,5 
y,=87,8 
y,= 86,9 
y,=26,3 
y,= 108,2 

i) t para 0=0,05 e GLE = 10 > t; = 2,228; 


i) DMS = 2,228 + = 3,67; 


iii) Coloque as médias em ordem decrescente e faça a diferença 
entre elas duas a duas, começando da diferença entre a maior e a 
menor média e assim por diante: 


y, =108,2 
y= 95,5 
y,= 87,8 
y,= 86,9 
y,= 26,3 
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5.5.3) Desvantagens 


como os tratamentos correspondem a todas as combinações 
possíveis entre os níveis dos fatores, o número de tratamentos a ser 
avaliado pode aumentar muito, não podendo ser distribuídos em 
blocos completos casualizados devido à exigência de 
homogeneidade das parcelas dentro de cada bloco. Isto pode levar 
a complicações na análise, sendo preciso lançar mão de algumas 
técnicas alternativas (como por exemplo, o uso de blocos 
incompletos). 


A análise estatística e a interpretação dos resultados pode tornar-se 
um pouco mais complicada que nos experimentos simples. 


5.5.4) Modelo estatístico do fatorial 


O modelo a seguir corresponde a um modelo de um delineamento 
em blocos casualizados (DBC) em esquema fatorial com 2 fatores 
(a e y), mas pode ser estendido para os casos em que há mais 
fatores, incluindo os fatores isolados e as interações duplas, triplas e 
outras entre os fatores. 


Yi = +B, + 0; + + (AY) + Cx 


em que, y; é o valor observado referente a parcela que recebeu o 


i-ésimo nível do fator œ e o k-ésimo nível do fator y no j-ésimo bloco; 
u representa uma constante geral; Bj representa o efeito do j-ésimo 
bloco; o; representa o efeito do i-ésimo nível do fator a; y representa 
o efeito do k-ésimo nível do fator y; (oy)x representa a interação 
entre o efeito do i-ésimo nível do fator œ e o efeito do do k-ésimo 
nível do fator y e ejk representa o erro experimental associado à 
observação Yik, suposto ter distribuição normal com média zero e 
variância comum. 


5.5.5) Exemplo de fatorial 


Em um experimento em blocos casualizados com 4 repetições, no 
esquema fatorial 2x3 foi avaliado o efeito de 2 variedades de cana- 
de-açúcar (V; e V2) e 3 tipos de inoculantes (l, l2 e l3) quanto ao 
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5.5) Experimentos fatoriais 
5.5.1) Características 


Em alguns experimentos, o pesquisador avalia dois ou mais tipos de 
tratamentos e deseja verificar se há interação entre estes tipos. Tais 
experimentos são denominados experimentos fatoriais e os tipos de 
tratamentos são denominados fatores. As categorias (subdivisões) 
de cada fator são ditas níveis do fator. Como exemplo, considere um 
experimento em que se comparou o efeito de 3 estirpes de rizóbio 
(BR 9001, BR 9004 e BR 4812) e o efeito de um determinado fungo 
(presença e ausência do fungo) na variável número de nódulos 
produzido pelo feijão. Neste caso, existem dois fatores: estirpe de 
rizóbio e a ocorrência do fungo. Os níveis do fator estirpe são 3 (BR 
9001, BR 9004 e BR 48122) e do fungo são 2 (presença e 
ausência). 


Costuma-se representar o fatorial pela multiplicação dos níveis. No 
exemplo anterior o fatorial é 3x2 (fatorial 3 por 2), assim fica claro 
que existem dois fatores, o primeiro fator com 3 níveis de estirpe e o 
segundo com 2 níveis de fungo. O número total de tratamentos 
avaliados também é dado pela multiplicação dos níveis, ou seja, no 
exemplo são avaliados 3x2 = 6 tratamentos avaliados (1: BR 9001 
na presença do fungo; 2: BR 9004 na presença do fungo; 3: BR 
4812 na presença do fungo; 4: BR 9001 na ausência do fungo; 5: 
BR 9004 na ausência do fungo; 6: BR 4812 na ausência do fungo. 
Se fossem, por exemplo, 3 fatores com 5, 2 e 3 níveis para cada 
fator respectivamente, a representação seria: fatorial 5x2x3, sendo 
avaliado um total de 30 tratamentos e assim por diante. 


Vale lembrar que os experimentos fatoriais não são delineamentos e 
sim um esquema de desdobramento de graus de liberdade de 
tratamentos, e podem ser instalado em qualquer dos delineamentos 
experimentais, DIC, DBC, etc. (Banzatto & Kronka, 1989). 


5.5.2) Vantagens 


- Permite estudar os efeitos principais dos fatores e os efeitos das 
interações entre eles. 
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Y, -Y4 = 108,2-26,3 = 81,9 > 819>367 Yu 
Ys-Y;= 108,2-86,9 = 21,3 > 21,3>367  Y,%Js 
Y,- Y,=108,2-87,8=20,4 > 204>367 =. Y,%: 
Y,- y, = 108,2-95,5 =12,7 > 12,7>3,67 = PJ 
Y, -Y4 = 95,5-26,3 = 69,2 = 69,2 >3,67 = y,#y4; 
Y,- Y, = 95,5-86,9 = 8,6 > 86>367 = y,#;; 
y,- Y, = 95,5-87,8 = 7,7 > 7,7>3,67 + HF; 
Y,-Y,= 87,8-26,3 = 61,5 = 61,5>367 + E 
Y,-Y;= 87,8-86,9 = 0,9 > 09<367  Y=Ys 
Y,- Y, = 86,9-26,3 = 60,6 = 60,6>3,67 = y,#7,; 


iv) Coloque letras iguais para médias semelhantes e letras distintas 
para médias que diferem entre si e interprete o teste. 


y, =108,2 a 
y= 95,5 b 
y,= 87,8 é 
y= 869 c 
y,= 26,3 d 


A linhagem 5 foi a que apresentou maior porcentagem de absorção 
de água diferindo das demais linhagens (Prob < 0,05). 


4.3) Teste de Tukey 


A diferença mínima significante (D.M.S.) entre duas médias pelo 
teste de Tukey é dada por: 
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em que q é um valor tabelado, o qual corresponde o valor obtido da 
combinação entre o número de tratamentos (|) e o grau de liberdade 
do erro (GLE) da análise de variância, para um nível de significância 
estabelecido (o). O QME e r já foram descritos no teste t. 


A interpretação é a mesma do teste t, ou seja, quando o valor 
absoluto da diferença entre duas médias for igual ou maior que a 
DMS, as médias podem ser consideradas estatisticamente 
diferentes. 


Exemplo 15: Compare as médias dos tratamentos do Exemplo14 
pelo teste de Tukey. 


i) q para 0=0,05; I= 5 tratamentos e GLE=10 = q=4,65; 


ii) DMS = 4,65, [2 = 5,42; 


ii) 7,-7,= 81,9 >5,42 0 y;#y4; 
Ys -y;=21,3 >5,42 = Vs 
YJ,- 9,=204 >5,42 0. Y5%J,; 
Js- = 12,7 >542 0 PJ 


y,J,-69,2 >5,42 Yu; 
y, ),=86 >5,42 + Ye: 
yi- Ss fr >5,42 cs MNA 
y, -y,=61,5 >5,42 0. Ju; 
y, -y;=0,9 <5,42 +. y,=Ya; 


7,-7,=60,6 >5,42  J,#7,; 
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SQ Bloco = (253,6 + 250,7” + 249,0” + 218,8” + 215,0”) — 70460,3205 


SQ Bloco = 70815,7225 — 70460,3205 = 355,4020. 
SQ Tratamento - 5091 +343,8º + 291,6” +259,6”) — 70460,3205 


SQ Tratamento = 71188,7140 — 70460,3205 = 728,3935. 
SQ Total = 72,8º + 58,32 +... + 27,4? + 39,0º — 70460,3205 
SQ Total = 73209,0700 — 70460,3205 = 2748,7495. 

SQ Erro = 2748,7495 — 355,4020 - 728,3935 = 1664,9540. 


E o quadro de análise de variância para os dados do Exemplo 5.4.5) 
é: 


FV GL SQ QM F Prob>F 
Bloco 4 355,4020 88,8505 0,640 0,6441 
Cobertura morta 3 728,3935 242,7978 1,750 0,2100 
Erro 12 1664,9540 138,7462 

Total 19 2748,7495 

CV (%)= 19,83 

Média geral: 59,4 Número de observações: 20 


Como Prob > 0,05 para cobertura morta, conclui-se que as quatro 
coberturas mortas tiveram influência semelhante no peso seco do 
brócolis. Neste caso, não há necessidade de aplicação de um teste 
de comparação múltipla. 


Observação: Se o valor de F para tratamento for significativo a 
determinado nível a de significância, o pesquisador pode usar um 
teste de comparação múltipla para comparar as médias dos 
tratamentos (caso este seja qualitativo), diz-se então que o teste 
usado é protegido; caso contrário, se F for não significativo, O 
pesquisador poderá optar ou não pelo uso do teste e, então, diz-se 
que o teste é não protegido. 


65 


5.4.7) Esquema de análise de variância do DBC com fontes de 
variação e graus de liberdade 


Considerando a mesma representação da Tabela 5, porém aqui, as 
repetições representam os blocos, o quadro de análise de variância 
para os dados de um delineamento em blocos casualizados (DBC) é 
expresso de uma maneira geral por: 


EV GL SQ QM F 
] 3 
Bloco J-1 -}.B?—C SQBloco/GLBloco QMBloco/QMErro 
Jai? 
1] 1 
Tratamento l-1 JET -C SQTrat./GLTrat QMTrat./QMErro 
i=l 
Erro -10-1 o SQErro/GLETTO 
LJ 2 
Total 1-1 Ly; € 
i,j=1 
4/QMErro 
cv(%)= = 100 
y 
3, ts 
y=} y;/ I 


i,j=1 


No exemplo 5.4.5) tem-se: 
- Delineamento: DBC; 


- Tratamentos: | = 4 tipos de cobertura morta (sorgo, crotalária, 
milheto e vegetação espontânea); 


- Repetições: J = 5; 
- Variável a analisar: peso seco (g/parcela). 


Assim, os valores das somas de quadrados para o exemplo 5.3.5) 
são: 


64 


iv) 
y,=108,2 a 
y= 95,5 b 
y,= 87,8 c 
y= 86,9 c 
y,= 26,3 d 


4.4) Teste de Duncan 


A diferença mínima significante (DMS) entre duas médias pelo teste 
de Duncan é dada por: 


QME 
= 


DMS =z, 


No teste de Duncan, se estão envolvidos | tratamentos no estudo, é 
necessário calcular |-1 DMS's. O que diferencia uma DMS da outra 
é o valor de zn que é um valor tabelado, o qual corresponde ao valor 
obtido da combinação entre o número de médias ordenadas 
abrangidas na comparação (n), e o grau de liberdade do erro (GLE) 
da análise de variância, ao nível de significância estabelecido (o). O 
QME e r já foram descritos nos testes anteriores. 


Para realização deste teste deve-se também ordenar as médias em 
ordem decrescente e ir fazendo a diferença sempre entre a maior e 
menor média, observando assim, o número (n ) de médias 
ordenadas abrangidas na comparação. 


A interpretação é a mesma dos testes anteriores, ou seja, quando o 
valor absoluto da diferença entre duas médias for igual ou maior que 
a D.M.S, as médias podem ser consideradas estatisticamente 
diferentes. A única diferença é que na comparação entre duas 
médias deve-se considerar o valor de DMS correspondente ao n em 
questão. Com o exemplo seguinte ficará mais fácil o entendimento. 
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Exemplo 16: Compare as médias dos tratamentos do Exemplo 14 Tabela 6. Peso seco (kg/parcela) de brócolis em um experimento 
pelo teste de Duncan. em blocos casualizados (DBC) com 5 repetições em que foi avaliada 
i) Como no exemplo tem-se l=5 médias de tratamentos é necessário PAROUS r BE a mona bl Sorgo, A Oroa aa a 
calcular Z5, Z4, Z3, € Z2 , OU Seja, é necessário o cálculo de z; = Z5 até svegerag P 


Z2: Rep. \ Trat. 1 2 3 4 Total 
Z5 para 0=0,05; n=5 eGLE=10 = Zs = 3,430; 1 72,8 69,0 45,3 66,5 253,6 
z, para 0=0,05; n=4 eGLE=10 = z, = 3,376; 3 RR E RR et ia 
3 50,4 72,1 67,2 59,3 249,0 
Z3 para 0=0,05; n=3 eGLE=10 => z= 3,293; 4 516 736 662 274 2188 
Zə para aœ=0,05; n=2 eGLE=10 > z= 3,151; 5 59,0 65,0 520 390 215,0 
ii) Calcula-se então as l-1= 4 DMS's: Total 2921 343,8 2916 2596 1187,1 
108 Média 58,4 68,8 58,3 51,9 59,4 
DMS, =3,430,/—— = 4,00; Correção (C) C = (1187,12/20 = 70460,3205 
V3 
n n=45=20 
4,08 
DMS, =3,376 =3,94; 
Y3 5.4.6) Croqui de campo 
4 BLI 2 3 1 4 
DMS, = BN Ni =3,84; 
BL II 4 1 2 3 
4,08 
DMS, = aah = 3,67. BL III 2 1 4 3 
iii) Lembrando que as médias colocadas em ordem decrescente BL IV 3 2 1 4 
são: 
J, =108,2 BLV 1 4 3 2 
yı= 95,5 A disposição dos tratamentos é realizada de forma aleatória dentro 
= dos blocos. 
y, = 87,8 
y,;= 86,9 
y,= 26,3 
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5.4.2) Vantagens 


- Controla diferenças nas condições ambientais de um bloco para 
outro. 


Ea di pa A2 
- Leva a uma estimativa mais exata da variância residual (° ), uma 
vez que a variação ambiental entre blocos é isolada. 


5.4.3) Desvantagens 


- Há uma redução no número de graus de liberdade do erro pois o 
DBC utiliza o princípio do controle local. 


- O número de tratamentos a ser utilizado é limitado pela exigência 
de homogeneidade dentro dos blocos, não podendo ser muito 
elevado. 


5.4.4)Modelo estatístico do DBC 


Yi =1 +b; +t; +e; 


em que, 2 representa a observação do i-ésimo tratamento no j- 
ésimo bloco; u representa uma constante geral associada a esta 
variável aleatória; bj representa o efeito do j-ésimo bloco; ti 
representa o efeito do i-ésimo tratamento; e eij representa o erro 
experimental associado a observação yij, suposto ter distribuição 
normal com média zero e variância comum. 


5.4.5) Exemplo de DBC 


Estudou-se a influência de 4 tipos de cobertura morta (sorgo, 
crotalária, milheto e vegetação espontânea) no peso seco de 
brócolis. O experimento foi instalado em DBC com 5 repetições. Os 
dados de peso seco estão dispostos na Tabela 6 a seguir. 
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E as diferenças entre elas duas a duas: 


Y5-Y4=81,9 =n=5 ..compara-se 81,9 com a DMS;  =81,9>4,00..Y,*Y4: 
Y5-Y5=21,3 => n=4 «.compara-se 21,3 coma DMS4=> 21,3 > 3,94 -. Y;# Y3; 
Y,- Y,=204=>n=3 ..compara-se 20,4 com a DMS;> 20,4>3,84 -. Y5%Y5: 
Y,- Yi =12,7 =n = 2 -.compara-se 12,7 coma DMS2= 12,7 > 3,67 ~. Y;+ Y} ; 
Yi- Y,4=69,2 =n = 4 -.compara-se 69,2 com a DMS4= 69,2 >3,94 -. Y,/*Y4; 

Yi- y;=8,6 =n =3 -.compara-se 8,6 coma DMS;> 8,6 >3,84 .. Y,*Y3; 

Yi- Y2=7,77 =n =2 -.compara-se 7,7 coma DMS2= 7,7 > 3,67 ~. Y, +Y, ; 
Y,-Y4=61,5=n=3 -.compara-se 61,5 com a DMS:> 61,5 > 3,84 . Y,+y4; 
Y, -Y3=0,9 =n =2 -.compara-se 0,9 com a DMS2= 0,9 < 3,67 =~ Y, =Y3; 
Y4-Y4=60,6 =n = 2 -.compara-se 60,6 com a DMS2= 60,6 > 3,67 -~ Y4%Y4- 


iv) Coloque letras iguais para médias semelhantes e letras distintas 
para médias que diferem entre si e interprete o teste. 


y, =108,2 a 
y= 95,5 b 
y, = 87,8 c 
y,= 86,9 c 
y,= 26,3 d 


4.5) Teste de SNK (Student Newman Keuls) 


A diferença mínima significante (DMS) entre duas médias pelo teste 
de SNK é dada por: 
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DMS, =q, M . 
r 


O procedimento para a realização deste teste é bastante 
semelhante ao do teste de Duncan. A diferença é que nas DMS's do 
SNK são usados os valores tabelados de qn ao invés de Zn, ou seja, 
deve-se procurar o valor tabelado na Tabela de q ao nível de 
significância estebelecido (o), correspondente a combinação entre o 
número de médias abrangidas na comparação (n) e o grau de 
liberdade do erro (GLE) da análise de variância. 


Exemplo 17. Compare as médias dos tratamentos do Exemplo 14 
pelo teste de SNK. 


i) Como no exemplo tem-se l=5 médias de tratamentos, é 
necessário calcular qs, q4, qs, € q2 , OU seja, é necessário o cálculo 
de q=qsaté go: 


qs para 0=0,05; n=5 eGLE=10 > qs=4,65; 

q, para 0=0,05; n=4 eGLE=10 > q =4,383; 

gs para 0=0,05; n=3 eGLE=10 > q= 3,88; 

qz para 0=0,05; n=2 eGLE=10 => q= 3,15; 
ii) Calcula-se então as |-1= 4 DMS's: 


DMS, = 465, as 5,42; 

DMS, = 4,33 filtra 5,05; 
V3 

DMS, = 388, E sa 4,52: 

DMS, = 315, = =3,67. 


E o quadro de análise de variância para os dados do Exemplo 5.3.5) 
é: 


FV GL SQ QM F Prob>F 
Variedades 3 13019,0330 4339,6776 5,668 0,0056 
Erro 20 15314,0178 765,7009 

Total 23 28333,0508 

CV (%): 18,41 

Média: y : 150,31 Número de observações: 24 


Como Prob < 0,05 (valor fornecido por alguns programas 
computacionais de análise de variância), conclui-se que há 
diferença estatística significativa entre as médias de peso seco da 
parte aérea das quatro variedades de cana-de açúcar. Deve-se 
então aplicar algum dos testes de comparação múltipla nestas 
médias. 


5.4) Delineamento em Blocos Casualizados (DBC) 
5.4.1) Características 


Os tratamentos são distribuídos aleatoriamente em blocos (princípio 
do controle local) de modo que haja maior uniformidade possível 
dentro de cada bloco. 


O número de parcelas por bloco é igual ao número de tratamentos, 
ou seja, cada bloco deverá conter todos os tratamentos. 


O DBC possui os três princípios básicos da experimentação: 
casualização, repetição e controle local e, portanto, as repetições 
são organizadas em blocos. 


Normalmente, é o delineamento mais utilizado em condições de 
campo. A eficiência do DBC depende da uniformidade dentro de 
cada bloco, podendo haver heterogeneidade entre blocos. Os 
blocos podem ser instalados na forma quadrada, retangular ou 
irregular, desde que seja respeitada a uniformidade dentro do bloco. 
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O quadro de análise de variância para os dados da Tabela 5 é: 


FV GL SQ QM F 
11 
Tratamento l-1 JET —C SQTrat./GLTrat. QMTrat./QMErro 
i=l 
Erro I(J-1) SQTotal -SQTrat. SQErro/GLErro 
LJ 2 
Total Di Ly-€ 


A 


CV(%)= v QMErro 100 
y 


LJ 
y= È y;/1 
i,j= 


No exemplo 5.3.5) tem-se: 

- Delineamento: DIC; 

- Tratamentos: | = 4 variedades de cana-de-açúcar (A, B, C, D); 

- Repetições: J = 6; 

- Variável a analisar: peso seco da parte aérea (g/parcela). 

Assim, os valores das somas de quadrados para o exemplo 5.3.5) 
são: 

SQ Tratamento = (667,59? +1005,30º +1011,87” +922,59º) — 542207,25 09 


SQ Tratamento = 555226,28389 — 542207,2509 = 13019,0330. 

SQ Total = 113,83? + 133,89° + . . . + 922,59? + 153,77? — 542207,25 
SQ Total = 570540,3017 - 542207,2509 = 28333,0508. 

SQ Erro = 28333,0508 — 13019,0330 = 15314,0178. 
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iii) Lembrando que as médias colocadas em ordem decrescente 
são: 


y, =108,2 
y= 95,5 
y,= 87,8 
y,= 86,9 
y,= 26,3 


E as diferenças entre elas duas a duas: 

Y5-Y4=81,9 =>n=5 ..compara-se 81,9 com a DMSs= 81,9 > 4,65 -. Y,%Y4: 
Y5-Y3=21,3 =n = 4 -.compara-se 21,3 com a DMS4= 21,3 > 4,33 ~. Y+ Y3; 
Y5- Y, =20,4 =n =3 ..compara-se 20,4 com a DMS;> 20,4 > 3,88 ». Y,%Y5: 
Y5- Yy; =12,7 =n = 2 -.compara-se 12,7 coma DMS2= 12,7> 3,15 ~. Y+ Y}; 
Yi- y4=69,2 =n = 4 -.compara-se 69,2 com a DMS4= 69,2 > 4,33 ». Y/*Y4; 
Y,Y3=86 =n=3 .compara-se 8,6 com a DMS;> 8,6>3,88 .. Y/*Y3; 
Yi- Y2=7,7 =>n=2.compara-se 7,7 com a DMS2> 7,7>3,15..Y,*Y5: 
Y,-Y4=61,5=n=3 -. compara-se 61,5 com a DMS = 61,5 > 3,88 -. Y, +y4; 


Y, -Y3=0,9 =n =2 -.compara-se 0,9 com a DMS2= 0,9<3,15.. Y, =Y3; 


Y3- y, = 60,6 = n = 2 -.compara-se 60,6 com a DMS2= 60,6 > 3,15 -~ Y3+Yy4. 
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v) Coloque letras iguais para médias semelhantes e letras distintas 
para médias que diferem entre si e interprete o teste. 


y, =108,2 a 
y= 95,5 b 
y, = 87,8 c 
y= 86,9 c 
y,= 26,3 d 


4.6) Teste de Scott-Knott 


O procedimento de Scott e Knott (1974) utiliza a razão de 
verossimilhança para atestar a significância de que os n tratamentos 
podem ser divididos em dois grupos que maximizem a soma de 
quadrados entre grupos (Ramalho et al., 2000). 


Seja por exemplo 3 tratamentos, A, B e C. O processo consiste em 
determinar uma partição, em dois grupos, que maximize a soma de 
quadrados. Veja que nesse caso são possíveis 2" grupos, isto é, A 
vsBeC,BvsAeCeCys Ae B. Com um número pequeno de 
tratamentos como o do exemplo, é fácil obter todos os grupos. 
Contudo, quando o número (n) de tratamentos é grande, o número 
de grupos cresce exponencialmente, dificultando a aplicação do 
teste. Para atenuar esse problema, basta ordenar as médias dos 
tratamentos. Nessa situação, o número de partições possíveis 
passa a ser obtido por n-1. Uma vez ordenada as médias, procede- 
se do seguinte modo, fazendo inicialmente o número de tratamentos 
envolvidos no grupo de médias considerado(g) igual ao o número 
total de tratamentos (n). 


i) Determinar a partição entre dois grupos que maximiza a soma de 
quadrados (SQ) entre grupos. Seja Tų e Tə os totais 
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A disposição das repetições de cada tratamento é realizada de 
forma totalmente aleatória às parcelas. 


5.3.7) Esquema de análise de variância do DIC com fontes de 
variação e graus de liberdade 


Imagine um experimento com | tratamentos e cada tratamento com 
J repetições representado na Tabela a seguir. 


Tabela 5. Representação esquemática dos dados de um 
delineamento inteiramente casualizado 


Rep. \ Trat. 1 2 3 2 l 
1 yu ya ya ... yir 
2 yı2 y2 y32 ... Yiz 
3 y1s y23 y33 ... yi3 
J yu yaj Yaj ae Yi 
I I 
Total Tı T2 Ts -> Tı PEDE 
isl i=1 
o Ze o E 
Média yı Y, y3 e yi y= a td 
Lj= 
LJ Z 
Correção (C) c -[ Yi ) /1J 
ij=l 
n n=lJ 
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5.3.5) Exemplo de DIC 


Suponha que foi avaliado o peso seco da parte aérea (g/parcela) de 
4 variedades de cana-de-açúcar. O experimento foi instalado em 
casa de vegetação. O delineamento foi o inteiramente casualizado 
com 6 repetições. Cada parcela era constituída de 1 vaso com 3 
plantas. Os dados de peso estão dispostos na Tabela a seguir: 


Tabela 4. Peso seco da parte aérea (g/parcela) de 4 variedades de 
cana-de-açúcar (A, B, C e D) em um delineamento inteiramente 
casualizado com 6 repetições 


Rep. \ Trat. A B C D 
1 113,83 174,94 21339 166,76 
2 133,89 168,76 86,69 131,17 
3 96,15 156,35 157,65 177,88 
4 101,22 14489 17444 121,23 
5 95,16 181,57 187,00 180,94 


6 127,34 178,79 192,70 144,61 


Total 667,59 1005,30 1011,87 922,59 3607,35 (total geral) 


Média 111,27 167,55 168,65 153,77 150,31 (média geral) 


Correção (C) C = (3607,35)2/24 = 542207,2509 


n n=46=24 


5.3.6) Croqui de campo 


C A B B 
D D C A 
C A D B 
B C B A 
C A D B 
A C D D 
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dos dois grupos com k; e kə tratamentos em cada um, a soma de 
quadrados B, é estimada por: 


Mb 0T) 


em que Ya é a média do tratamento da posição ordenada i. 


Os dois grupos deverão ser identificados por meio da inspeção das 
somas de quadrados das g-1 partições possíveis, sendo g o número 
de tratamentos envolvidos no grupo de médias considerado. 


ii) Determinar o valor da estatística À: 
qui T B, 
YUn-2) 6? 


em que 6, é o estimador de máxima verossimilhança de o; dado 
por: 


Q) 


o= m ps? | 
g+v 


em que v é o grau de liberdade do erro associado a este estimador, 


y é a média das médias dos g tratamentos e ,; -QOME é o 
y 
r 


estimador não viesado de 6; sendo QME o quadrado médio do 
erro e r o número de repetições. 

iii) Se A > Fa E rejeita-se a hipótese de que os dois grupos são 
idênticos em favor da hipótese alternativa de que os dois grupos 
diferem. ico é um valor tabelado obtido na Tabela de 
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Qui-quadrado (encontrada em alguns livros de estatística), 
correspondente a combinação entre o nível de significância 
estebelecido (œ) e o valor dado por g/(n-2) . 


iv) No caso de rejeitar esta hipótese, os dois subgrupos formados 
serão independentemente submetidos aos passos i) a iii), fazendo 
respectivamente g=k; e g=k>. O processo em cada subgrupo se 
encerra ao se aceitar H, no passo iii) ou se cada subgrupo contiver 
apenas uma média. 


Exemplo 18. Agora vamos aplicar o algoritmo do teste de Scott e 
Knott nas médias do Exemplo 14 em que o quadrado médio do erro 
foi de 4,08 com 10 graus de liberdade, e as médias das 5 linhagens 
de feijão estimadas a partir de 3 repetições foram: 


7, =a = 26,3 
Y, =7 = 86,9 
Y, =7o = 87,8 
Y=Yey= 95,5 
Y; = Yo = 108,2 


lembrando que y é a média do tratamento da posição ordenada i, 
com i=1,...,5. 
i) SQ da partição (1) vs (2), (3), (4) e (5) 
p 263 (86,9 +87,8 +95,5 +108,2)? (26,3+869+87,8+95,5+ 108,2)? 
o l 4 5 
Bo = 691,6900 + 35796,6400 - 32756,4180 = 3731,9120; 
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alternância das parcelas evita-se uma possível vantagem de algum 
tratamento. A instalação do DIC no campo experimental exige uma 
certa homogeneidade das condições ambientais (como por exemplo 
quanto a fertilidade do solo, distribuição uniforme de água, etc.). 


5.3.2) Vantagens 


- Possui grande flexibilidade quanto ao número de tratamentos e 
repetições, sendo dependente, entretanto, da quantidade de 
material e área experimental disponíveis. 


- Pode-se ter DIC não balanceado, ou seja, com números de 
repetições diferentes entre tratamentos, o que não leva a 
grandes alterações n 


- a análise de variância; mas os testes de comparações múltiplas 
passam a ser aproximados e não mais exatos. O ideal é que os 
tratamentos sejam igualmente repetidos. 


- Considerando o mesmo número de parcelas e tratamentos 
avaliados, é o delineamento que possibilta o maior grau de 
liberdade do erro. 


5.3.3) Desvantagens 


- Exige homogeneidade das condições experimentais. Se as 
condições não forem uniformes, como se esperava antes da 
instalação do experimento, toda variação (exceto à devida a 
tratamentos) irá para o erro, aumentando sua estimativa e 
reduzindo, portanto, a precisão do experimento. 


5.3.4) Modelo estatístico do DIC 
yj =ì +t; +e; 
em que, y; representa a observação do i-ésimo tratamento na j- 


ésima repetição; u representa uma constante geral associada a esta 
variável aleatória; ti representa o efeito do i-ésimo tratamento; e ejj 
representa o erro experimental associado a observação yi, suposto 
ter distribuição normal com média zero e variância comum. 
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5.2.4) Homogeneidade: os erros devem apresentar variâncias 
comuns (homogeneidade = homocedasticidade de variâncias). 


Estas pressuposições visam facilitar a interpretação dos resultados 
e testar a significância nos testes de hipóteses. Na prática, o que 
pode ocorrer é a validade aproximada e não exata de alguma (s) 
destas pressuposições; neste caso, o pesquisador não perderia 
tanto com a aproximação visto que os testes aplicados na análise de 
variância são robustos quanto a isto. A homogeneidade de 
variância é que, na maioria das vezes, é necessária pois, caso não 
seja verificada, o teste F e de comparações múltiplas poderão ser 
alterados. 


Quando alguma (s) das pressuposições da análise não se 
verifica(m), existem alternativas que podem ser usadas, entre elas a 
transformação de dados com a posterior análise de variância 
destes dados transformados; ou a utilização dos recursos da 
estatística não paramétrica. 


Feitas as considerações iniciais necessárias para o entendimento 
dos próximos assuntos, iniciaremos agora os conceitos e exemplos 
dos delineamentos mais usuais. 


5.3) Delineamento Inteiramente Casualizado (DIC) 
5.3.1) Características 


- Os tratamentos são distribuídos nas parcelas de forma 
inteiramente casual (aleatória). 


- O DIC possui apenas os princípios da casualização e da repetição, 
não possuindo controle local e, portanto, as repetições não são 
organizadas em blocos. 


- Normalmente é mais utilizado em experimentos de laboratório; 
experimentos em vasos ou bandejas em casa de vegetação, onde 
há possibilidade de controle das condições ambientais. Nos 
experimentos em casa de vegetação recomenda-se constantemente 
mudar as parcelas de posição para evitar diferenças ambientais 
devido a posição da parcela na casa de vegetação. Com esta 
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SQ da partição (1) e (2) vs (3), (4) e (5) 


_ (26,3+86,9)" (87,8 +95,5 +1082) _ (26,3 +86,9 +87,8+95,5 + 108,2)? 
a 2 3 5 
Bo = 6407,1200 + 28324,0833 - 32756,4180 = 1974,7853; 


SQ da partição (1), (2) e (3) vs (4) e (5) 


p 6263+869 +878)? (05,5+10827 _ (26,3 +86,9 +87,8 +95,5 + 108,2)? 
a 3 2 5 
Bo = 13467,0000 + 20746,8450 - 32756,4180 = 1457,4270; 


SQ da partição (1), (2), (3) e (4) vs (5) 


p - 26,3+869+878+955) 1082" (26,3+869+878+95,5 + 108,2)? 
o 4 1 5 
B, = 21978,0625 + 11707,2400 -32756,4180 = 928,8845. 


A partição (1) vs (2), (3), (4) e (5) foi a que maximizou a soma de 
quadrados entre grupos (Bo = 3731,9120). 


ii) Considerando g=5, v=10 e y- 263+869+878+955+1082 _ 4094 


5 
tem-se: 
G = = (26,3 80,94)” +... + (108,2 — 80,94)” + 10,208 
5+10 3 


6? = “5 [4023.2120 +13,6000] = 269,1208 


cm 37319120 
7-2) 269,1208 


=19,0806. 
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O valor de %oos:sux-2) = Xv0.05: 4.80) É 10,089. Como À > 10,089 
rejeita-se Ho, ou seja dois grupos são formados ao nível de 5%, o 
grupo 1 com apenas o tratamento (linhagem) 4=(1) e o grupo 2 com 
os tratamentos 3=(2), 2=(3), 1=(4) e 5=(5). 

Deve-se então repetir o algoritmo apenas para os subgrupos que 
contém mais de um tratamento, no caso apenas para o grupo 2. 


i) SQ da partição (2) vs (3), (4) e (5) 


B = 86,9 X% (87,8 +95,5 + 108,2)? _ (86,9 +87,8 +95,5+ 108,2)? 
j 1 3 4 
Bo = 7551,6100 + 28324,0833 - 35796,6400 = 79,0533; 


SQ da partição (2) e (3) vs (4) e (5) 


(86,9 +87,8)? E (95,5 + 108,2)? _ (86,9+87,8+95,5+ 108,2)? 
i 2 2 4 
Bo = 15260,0450 + 20746,8450 -35796,6400 = 210,2500; 


B 


SQ da partição (2), (3) e (4) vs (5) 


_ (86,9 +87,8 +95,5) | 108,2” (86,9 +87,8 +95,5 + 108,2)? 
° 3 1 4 
Bo = 24336,0133 + 11707,2400 - 35796,6400 = 246,6133. 


B 


A partição (2), (3) e (4) vs (5) foi a que maximizou a soma de 
quadrados entre grupos (B, = 246,6133). 
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seria possível realizar testes de hipóteses. O uso de um número 
adequado de repetições, possibilita uma boa estimativa do erro 
experimental, melhorando as estimativas de interesse. No entanto, o 
número de repetições pode ser limitado, por exemplo, pelo número 
de tratamentos que serão comparados, pela disponibilidade de 
material e de área experimental, entre outros fatores. 


5.1.2) Casualização: refere-se à distribuição aleatória dos 
tratamentos ès parcelas de modo que todas as parcelas tenham a 
mesma chance de receber qualquer um dos tratamentos. Com isso, 
a casualização evita que determinado tratamento seja favorecido e 
garante que os erros sejam independentes (Mead & Curnow, 1983). 
Alguns programas computacionais elaboram planilhas de campo já 
com os tratamentos aleatorizados, como por exemplo o MSTAT, 
SISVAR e outros. 


5.1.3) Controle local: a idéia básica do controle local é a partição 
do conjunto total de parcelas em subconjuntos (blocos) que sejam 
os mais homogêneos possíveis. Para Hinkelmann & Kempthorne 
(1994), o princípio do controle local é o reconhecimento de padrões 
supostamente associados às parcelas. Este princípio é utilizado 
para atenuar problemas de heterogeneidade ambiental (por exemplo 
de solo, de distribuição de água no caso de experimentos irrigados, 
etc). 


5.2) Pressuposições básicas da análise de variância 


Para realização de uma análise de variância deve-se aceitar 
algumas pressuposições básicas: 


5.2.1) Aditividade: os efeitos de tratamentos e erro devem ser 
aditivos; 


5.2.2) Independência: os erros devem ser independentes, ou seja, 
a probabilidade de que o erro de uma observação qualquer tenha 
um determinado valor não deve depender dos valores dos outros 
erros; 


5.2.3) Normalidade: os erros devem ser normalmente distribuídos; 
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ii) Teste de Tukey: 


DMS=q er 
CR o 2 


iii) Teste de Duncan: 


DMS=z, [er 
r ç 2 

SNK =q, [er 
i f 2 


com r e r, sendo o número de repetições do tratamento i e i, 
respectivamente. 


iv) Teste de SNK: 


5) Análise de variância 


A análise de variância (ANAVA) é um dos métodos para análise dos 
dados que visa decompor a variação total entre parcelas em fontes 
(causas) de variação devidas a efeitos principais dos fatores, efeitos 
de interações entre fatores, efeitos de aninhamento e resíduo (erro). 


Para facilitar o entendimento, antes de partirmos para exemplos de 
análises de variância, é necessário fazer alguns comentários sobre 
os princípios básicos da experimentação e também sobre as 
pressuposições da análise de variância. 


5.1) Princípios básicos da experimentação 


Os delineamentos experimentais clássicos são baseados nos três 
conceitos a seguir, estabelecidos por Fisher (1935). 


5.1.1) Repetição: refere-se ao número de parcelas que receberão 
um mesmo tratamento. Os tratamentos devem ser repetidos, 
possibilitando, assim, estimar o erro experimental sem o qual não 
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— 869+87,8+95,5+108,2 


ii) Considerando g=4, v=10 e y= F = 94,60 
tem-se: 
5? = nin (86,9 — 94,60)” +... + (108,2 — 94,60)” +10. AL 
4+10 3 


6? = = [291,3000 + 13,6000] = 21,7786 


CT 2466133 
1-2) 21,7786 


=15,5810. 


O valor de X?oos: 44n- 008.450) É 10,253. Como à > 10,253 


rejeita-se Ho, ou seja dois grupos são formados ao nível de 5%, o 
grupo 1 com os tratamentos (linhagens) 3=(2), 2=(3) e 1=(4)e o 
grupo 2 com apenas o tratamento 5=(5). 


Deve-se então repetir o algoritmo apenas para o grupo 1. 
i) SQ da partição (2) vs (3) e (4) 
B = 86,9? x (87,8+ 95,5)” _ (86,9 +87,8 + 95,5)? 
i 1 2 3 
Bo = 7551,6100 + 16799,4500 — 24336,0133 = 15,0417; 


SQ da partição (2) e (3) vs (4) 


B = (86,9 + 87,8)? x 95, _ (86,9 +87,8 + 95,5)? 
j 2 1 3 
Bo = 15260,0450 + 9120,2500 — 24336,0133 = 44,2817; 


A partição (2) e (3) vs (4) foi a que maximizou a soma de quadrados 
entre grupos (B, = 44,2817). 
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— 869+87,8+95,5 


ii) Considerando g=3, v=10 e y= j = 90,07 tem-se: 
-2 1 2 2 2 4,08 
6,=>—— [369 — 90,07)“ + (87,8 — 90,07) + (95,5 — 90,07)" + 104] 

3+10 3 


5? = [44,6867 + 13,6000] = 4,4836 


o T 44,2817 
(T—2) 4,4836 


= 13,5896. 


O valor de Xios: 342-2) = X 0.05: 2.628) É 7,136. Como À > 7,136 rejeita- 


se Ho, ou seja dois grupos são formados ao nível de 5%, o grupo 1 
com os tratamentos (linhagens) 3=(2), 2=(3) e o grupo 2 com 
apenas o tratamento e 1=(4). 


Deve-se então repetir novamente o algoritmo para o grupo 1. 
i) SQ da partição (2) vs (3) 
(869º 878º _ (86,9 +87,8) 
i 1 1 2 
Bo = 7551,6100 + 7708,8400 — 15260,0450 = 0,4050; 


Neste caso, a partição (2) vs (3) por ser única foi a que maximizou a 
soma de quadrados entre grupos (B, = 0,4050). 


B 


_ 869+878 


ii) Considerando g=2, v=10 e y = —>———— = 87,35 tem-se: 
6? = E (86,9 — 87,35)” + (87,8 — 87,35)” +10. 406 
2+10 3 
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6º = Z [0,4050+ 13,6000] =1,1671 


= m 0,4050 
2Xn-2) 1,1671 


= 0,4775. 


O valor de X{o,os: 247-2) = X10.05: 17s é 5,458. Como À < 5,458 aceita- 


se Hə, ou seja, os dois grupos são idênticos ao nível de 5%, 
formando um único grupo com os tratamentos (linhagens) 3=(2) e 
2=(3), finalizando assim o algoritmo. 


Colocando letras diferentes para médias distintas e letras iguais 
para médias semelhantes por meio do teste Scott e Knott tem-se 
então: 


Y4 =Y = 26,3 d 
Y3=Y = 86,9 c 
Y2 =Y = 87,8 c 
7=1)-95 b 
Ys= Ycy= 108,2 a 


Observações: Nestes exemplos os resultados de todos os testes 
realizados foram iguais mas poderiam ter diferenciado entre um ou 
outro teste. Quando o número de repetições é diferente entre os 
tratamentos as DMS's podem ser calculadas por: 


i) Teste t: 


PTEN [iij 
T ç 
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